feedback from mayo and a few read throughs
[bmh-research_statement] / research_statement.tex
1 \documentclass[10pt]{memoir}
2
3 % based on kieran healy's memoir modifications
4 \usepackage{mako-mem}
5 \chapterstyle{article-3}
6 \pagestyle{memo}
7
8 \usepackage{ucs}
9 \usepackage[utf8x]{inputenc}
10
11 \usepackage[T1]{fontenc}
12 \usepackage{textcomp}
13 \usepackage[garamond]{mathdesign}
14
15 \usepackage[letterpaper,left=1.2in,right=1.2in,top=1.2in,bottom=1.2in]{geometry}
16
17 % packages i use in essentially every document
18 \usepackage{graphicx}
19 \usepackage{wrapfig}
20 \usepackage{enumerate}
21
22 % packages i use in many documents but leave off by default
23 % \usepackage{amsmath, amsthm, amssymb}
24 % \usepackage{dcolumn}
25 % \usepackage{endfloat}
26
27 % import and customize urls
28 \usepackage[usenames,dvipsnames]{color}
29 \usepackage[breaklinks]{hyperref}
30
31 \hypersetup{colorlinks=true, linkcolor=Black, citecolor=Black, filecolor=Blue,
32     urlcolor=Blue, unicode=true}
33
34 % add bibliographic stuff 
35 % \usepackage[round]{natbib}
36 % \def\citepos#1{\citeauthor{#1}'s (\citeyear{#1})}
37 % \def\citespos#1{\citeauthor{#1}' (\citeyear{#1})}
38
39 % import vc stuff after running `make vc`: \input{vc} \pagestyle{kjhgit}
40
41 \begin{document}
42
43 \setlength{\parskip}{4.5pt}
44
45 \baselineskip 14.5pt
46
47 \title{Research Statement}
48 \author{Benjamin Mako Hill}
49
50 \maketitle
51
52 I study collective action in online communities and seek to understand
53 why some attempts at collaborative production -- like Wikipedia and
54 Linux -- build large volunteer communities while the vast majority
55 never attract even a second contributor. I am particularly interested
56 in how the design of communication and information technologies shape
57 fundemental social outcomes with broad theoretical and practical
58 implications -- like the decision to join a community or contribute to
59 a public good. My research is deeply interdisciplinary, consists
60 primarily of ``big data'' quantitative analyses, and lies at the
61 intersection of sociology, communication, and human-computer
62 interaction.
63
64 Using Internet-based peer production projects as my research settings,
65 my work seeks to understand the conditions for collective action using
66 observational data from real communities.  This work has been shaped
67 by three complentary approaches: (1) the comparison of failures to
68 build communities to rare successful attempts through the use of
69 projects as the unit of analysis; (2) attention to the role of
70 reputation and status in the mobilization of volunteers; and (3)
71 analysis of design changes as ``natural experiments'' building a
72 deeper, and often causal, understanding of social processes using
73 observational data. Nearly all of my work incorporates at least two of
74 these approaches.
75
76 \section{Projects As Unit of Analysis}
77
78 Although there have been many thousands of studies of online
79 collective action the vast majority have only considered successful
80 projects like Wikipedia and Linux.  The majority of research on
81 collective action -- on and offline -- has only considered projects
82 that have successfully mobilized. In this sense, most previous
83 analyses of collection action have systematically selected on their
84 dependent variable. Most of my research treats projects as the unit of
85 analysis and collective action as the outcome of interest.
86
87 % \begin{wrapfigure}{r}{0.4\textwidth}
88 %  \begin{centering}
89 %  \includegraphics[width=2.4in]{figures/wp_citations_by_year.png}
90 %  \caption{Number of published academic articles with ``wikipedia''
91 %  in title by year.}
92 %  \label{fig:wppapers}
93 %  \end{centering}
94 %\end{wrapfigure}
95
96 \begin{wrapfigure}{r}{2.6in}
97  \begin{centering}
98  \includegraphics[width=2.6in]{figures/scratch_screenshot_default.png}
99  \caption{A screenshot of the Scratch programming environment
100    where users create animations and interactive games.}
101  \label{fig:scratchapp}
102  \end{centering}
103  \vspace{-2em}
104 \end{wrapfigure}
105
106 In one study, I compare Wikipedia to seven attempts to create online
107 collaborative encyclopedia projects that were launched previously
108 \cite{hill_almost_2012}. Using an inductive, grounded-theory based
109 analysis of founder interviews and archival data, I propose four
110 hypothesis to explain why Wikipedia attracted many more
111 contributors. Although the paper's methods diverge from the
112 quantitative, ``big data'' approach typical of most of my work, the
113 research question and strategy is representative.
114
115 I have also followed this strategy in a series of quantitative
116 studies of the Scratch online community: a public website where a large
117 community of users create, share, and remix interactive media. The
118 community is built around the Scratch programming environment: a
119 freely downloadable desktop application that allows amateur creators
120 to combine media with programming code (see Figure
121 \ref{fig:scratchapp}). Despite the fact that Scratch is a community
122 designed to promote collaboration through content remixing, only about
123 ten percent of Scratch projects attract a second
124 contributor.
125
126 In one study, forthcoming in American Behavioral Scientist, I test
127 several of the most widely cited theories associated with
128 ``generativity'' (i.e., qualities of technology or content that make
129 some works more fertile ground for collaboration). I find some support
130 for existing theory but also find that, across the board, factors
131 associated with more collaboration are also associated with less
132 original and transformative types of joint-work
133 \cite{hill_remixing_2012}. In another study of Scratch, I show that
134 this type of superficial collaboration leads to negative reactions and
135 community displeasure \cite{hill_responses_2010}.
136
137 \begin{wrapfigure}{l}{2.6in}
138  \begin{centering}
139  \includegraphics[width=2.6in]{figures/frontpage_modified-topremix.png}
140   \caption{The front page of the Scratch online community where users
141     can share and collaborate on projects.}
142  \label{fig:scratchfrontpage}
143  \end{centering}
144  \vspace{-2em}
145 \end{wrapfigure}
146
147 This year, I am conducting a population-level analysis in a new
148 dataset I have created that includes 80,000 attempts at wikis (i.e.,
149 public, editable, websites similar to Wikipedia). In my first working
150 paper using this dataset, I consider inter-organizational effects of
151 competition for volunteer labor and find little support for a widely
152 cited ecological model of collective action from sociology that treats
153 volunteer labor as a fixed and finite resource. Instead, I show that
154 contributions to different wikis on the same topic or theme are driven
155 primarily by environment-level changes in interest and that projects
156 may even benefit from complimentarities and synergies
157 \cite{hill_is_2012}.
158
159 \section{Reputation and Status}
160
161 Although empirical research comparing successful and unsuccessful peer
162 production projects has been rare, theories have been widespread. No
163 theory has been more influential than the suggestion that, in the
164 absence of pecuniary rewards, contributions to online public goods are
165 driven by the possibility of increased reputation and status for
166 contributors.
167
168 \begin{wrapfigure}{r}{0.3\textwidth}
169  \vspace{-1em}
170  \begin{centering}
171  \includegraphics[width=1.9in]{figures/barnstar_alone.png}
172  \caption{Image of a ``barnstar'' social award given by Wikipedia
173    contributors to each other to recognize positive contributions .}
174  \label{fig:barnstar}
175  \end{centering}
176  \vspace{-1em}
177 \end{wrapfigure}
178
179 In a study of status-based awards in Wikipedia called ``barnstars''
180 (see Figure \ref{fig:barnstar}) I provide an empirical test of an
181 influential status-based theory of collective action from
182 sociology. Although the study finds support for the widely
183 hypothesized ``virtuous cycle'' of status rewards both causing and
184 being caused by contributions, it also finds that this effect is
185 limited to a sub-population of Wikipedia contributors -- ``signalers''
186 who show off their awards \cite{hill_status_2012}. This result
187 has broad implications for both status-based theories of collective
188 action as well the design of reputation-based rewards.
189
190 In a mixed methods study of Scratch, nominated for best paper at the
191 CHI 2011 conference \cite{monroy-hernandez_computers_2011}, I
192 present both a quantitative analysis of a design change and in-depth
193 interviews of users to demonstrate how credit-giving is ineffective
194 when it stems from an automated system because systems fail to
195 reinforce status-ordering with credible human expressions of social
196 deference and gratitude.
197
198 %\newpage
199 \section{Design-Driven Natural Experiments}
200
201 Although nearly all of my work has important implications for the
202 design of socio-technical systems, I have structured much of my work
203 around the evaluation of technological design changes. In several
204 papers, I treat design changes as ``natural experiments'' that
205 exogenously change the ways that social structure is enacted. By doing
206 so, I can both build causal understandings of social phenomena from
207 field data, and can tighten the distance between theory and design.
208
209 \begin{wrapfigure}{r}{0.25\textwidth}
210  \vspace{-1em}
211  \begin{centering}
212  \includegraphics[width=1.5in]{figures/lilypad.png}
213  \caption{A image of the LilyPad Arduino microcontroller.}
214  \label{fig:lilypad}
215  \end{centering}
216  \vspace{-1em}
217 \end{wrapfigure}
218
219 For example, to evaluate the impact of status-based incentives and
220 collaboration in Scratch, I use a regression discontinuity framework
221 to measure the causal effect of increased status for collaboration
222 \cite{hill_causal_2012}. I show that highlighting collaborative
223 projects on the Scratch web page (see the bottom of Figure
224 \ref{fig:scratchfrontpage}) resulted in more collaboration but also
225 caused a decrease in the amount of total effort exerted by
226 contributors. Speaking to fundamental sociological work in the
227 literature on collective action, I present evidence that this decrease
228 is driven by both an the influx of new contributors and a decrease in
229 the effort and contributions of established participants.
230
231 In other work, I have analyzed sales records of hobbyist
232 microcontrollers to argue that relatively simple design changes in the
233 \emph{LilyPad Arduino} -- a electronics toolkit minimally re-designed
234 for women and girls (see Figure \ref{fig:lilypad}) -- lead to large
235 increases in the proportion of women contributors and drastic shifts
236 in the type of projects created \cite{buechley_lilypad_2010}. I have
237 also explored how technical errors may be able to provide similar
238 opportunities for analysis \cite{hill_revealing_2010}.
239
240 % or changes in socio-technical systems describing responsibility for a piece of software can lead to an important impact in the type and structure of contributions in peer production \cite{michlmayr_quality_2003}
241
242 \section{Research Agenda}
243
244 My research agenda involves further exploration of the determinants of
245 collection action online -- especially using a series of large new
246 datasets I have recently assembled. I plan to both continue on this
247 research trajectory and to create new social and technical
248 infrastructure that will allow others researchers to join me in ``big
249 data'' observational research with active communities. This section
250 outlines some future directions I plan to explore.
251
252 \emph{Understanding the Relationship Between Collective Action and
253   Performance} -- My work has treated collective action and production
254 as ends in themselves and has largely avoided the consideration of
255 issues of performance, efficiency, and quality. Using my existing
256 datasets, I plan to compare the performance of collaborative
257 production to individually produced works to understand when
258 successful collection action leads to increased performance. For
259 example, in a manuscript currently under review using data from
260 Scratch, I show important limitations of collaboration through
261 remixing in regards to project quality, particularly for more artistic
262 or media-intensive works \cite{hill_cost_2012}.
263
264 \emph{Integrated Theory of Design for Collective Action} -- My studies
265 of status and reputation provide a detailed understanding of the dynamics of
266 collection action in relation to one set of important predictors. In future
267 work, I plan to evaluate the effect of governance and different
268 systems of authority, framing, modularity and project complexity. In
269 the long term, I hope to offer a broad set of principles of
270 design for online collection action and community.
271
272 \emph{Toolkits for Experimental Social Design} -- My research has been
273 possible through personal relationships I have with a series of
274 organizations with large, active, online communities (e.g., the MIT
275 Media Lab and the Wikimedia Foundation). These organizations, like
276 many others, make design changes to the software that supports their
277 communities to encourage contributions and improve users'
278 experiences. Most of the time, these organizations have very little
279 idea if these changes are effective. I plan to seek funding for, and
280 to create, a technical framework and a network of academic and
281 practitioner collaborators, to facilitate well-designed natural
282 experiments by the hosts of large online communities and to share data
283 that allows for academic evaluation of these experiments.
284
285 Although I study cooperation, I also practice it. In graduate school,
286 I have collaborated with a large and engaged group of co-authors in
287 many academic departments. I intend to continue doing so. In sum, my
288 research uses design to contribute to social scientific theories of
289 collective action, and uses theories of collective action to influence
290 design. Although my research settings are online communities, I
291 believe my work has implications for a broad range of disciplines and
292 fields.
293
294 % bibliography here
295 \renewcommand{\bibsection}{\section{\bibname}\prebibhook}
296 \baselineskip 14.2pt
297 \bibliography{refs-processed}
298 \bibliographystyle{unsrt}
299
300 \end{document}
301

Benjamin Mako Hill || Want to submit a patch?