rename file to match the published version
[bmh-research_statement] / bmh-research_statement.tex
1 \documentclass[10pt]{memoir}
2
3 % based on kieran healy's memoir modifications
4 \usepackage{mako-mem}
5 \chapterstyle{article-3}
6 \pagestyle{memo}
7
8 \usepackage{ucs}
9 \usepackage[utf8x]{inputenc}
10
11 \usepackage[T1]{fontenc}
12 \usepackage{textcomp}
13 \usepackage[garamond]{mathdesign}
14
15 \usepackage[letterpaper,left=1.2in,right=1.2in,top=1.15in,bottom=1.1in]{geometry}
16
17 % packages i use in essentially every document
18 \usepackage{graphicx}
19 \usepackage{wrapfig}
20 \usepackage{enumerate}
21
22 % packages i use in many documents but leave off by default
23 % \usepackage{amsmath, amsthm, amssymb}
24 % \usepackage{dcolumn}
25 % \usepackage{endfloat}
26
27 % import and customize urls
28 \usepackage[usenames,dvipsnames]{color}
29 \usepackage[breaklinks]{hyperref}
30
31 \hypersetup{colorlinks=true, linkcolor=Black, citecolor=Black, filecolor=Blue,
32     urlcolor=Blue, unicode=true}
33
34 % add bibliographic stuff 
35 % \usepackage[round]{natbib}
36 % \def\citepos#1{\citeauthor{#1}'s (\citeyear{#1})}
37 % \def\citespos#1{\citeauthor{#1}' (\citeyear{#1})}
38
39 % import vc stuff after running `make vc`: \input{vc} \pagestyle{kjhgit}
40
41 \begin{document}
42
43 \setlength{\parskip}{4.5pt}
44
45 \baselineskip 14.5pt
46
47 \title{Research Statement}
48 \author{Benjamin Mako Hill}
49
50 \maketitle
51
52 I study collective action in online communities and seek to understand
53 why some attempts at collaborative production -- like Wikipedia and
54 Linux -- build large volunteer communities while the vast majority
55 never attract even a second contributor. I am particularly interested
56 in how the design of communication and information technologies shape
57 fundemental social outcomes with broad theoretical and practical
58 implications -- like the decision to join a community or contribute to
59 a public good. My research is deeply interdisciplinary, consists
60 primarily of ``big data'' quantitative analyses, and lies at the
61 intersection of sociology, communication, and human-computer
62 interaction.
63
64 Using Internet-based peer production projects as my research settings,
65 my work seeks to understand the conditions for collective action using
66 observational data from real communities.  This work has been shaped
67 by three complentary approaches: (1) the comparison of failures to
68 build communities to rare successful attempts; (2) attention to the
69 role of reputation and status in the mobilization of volunteers; and
70 (3) analysis of design changes as ``natural experiments'' building a
71 deeper, and often causal, understanding from observational
72 data. Nearly all of my work incorporates at least two of these
73 approaches.
74
75 \section{Studying Attempts at Collective Action}
76
77 Although there have been many thousands of studies of online
78 collective action, the vast majority have only considered projects
79 like Wikipedia and Linux that have successfully built communities -- a
80 characterization that can be extended to observational work on
81 collective action more generally. In this sense, most previous
82 analyses have systematically selected on their dependent
83 variable. Instead, most of my research treats projects as the unit of
84 analysis and collective action as the outcome of interest -- comparing
85 the successful examples of collective action to attempts that never
86 got off the ground.
87
88 % \begin{wrapfigure}{r}{0.4\textwidth}
89 %  \begin{centering}
90 %  \includegraphics[width=2.4in]{figures/wp_citations_by_year.png}
91 %  \caption{Number of published academic articles with ``wikipedia''
92 %  in title by year.}
93 %  \label{fig:wppapers}
94 %  \end{centering}
95 %\end{wrapfigure}
96
97 \begin{wrapfigure}{r}{2.6in}
98  \begin{centering}
99  \includegraphics[width=2.6in]{figures/scratch_screenshot_default.jpg}
100  \caption{A screenshot of the Scratch programming environment
101    where users create animations and interactive games.}
102  \label{fig:scratchapp}
103  \end{centering}
104  \vspace{-2em}
105 \end{wrapfigure}
106
107 In one study, I compare Wikipedia to seven attempts to create online
108 collaborative encyclopedia projects that were launched previously
109 \cite{hill_almost_2012}. Using an inductive, grounded-theory based
110 analysis of founder interviews and archival data, I propose four
111 hypotheses to explain why Wikipedia attracted many more
112 contributors. Although the paper's methods diverge from the
113 quantitative, ``big data'' approach typical of most of my work, the
114 research question and strategy is representative.
115
116 I have also followed this strategy in a series of quantitative studies
117 of the Scratch online community: a public website where millions
118 of users create, share, and remix interactive media. The
119 community is built around the Scratch programming environment: a
120 freely downloadable desktop application that allows amateur creators
121 to combine media with programming code (see Figure
122 \ref{fig:scratchapp}). Although Scratch is a community designed to
123 promote collaboration through content remixing, only about ten percent
124 of Scratch projects attract a second contributor.
125
126 In one study, co-authored with Andrés Monroy-Hernández and forthcoming
127 in American Behavioral Scientist, I test several of the most widely
128 cited theories associated with ``generativity'' (i.e., qualities of
129 technology or content that make some works more fertile ground for
130 collaboration). I find some support for existing theory but also find
131 that, across the board, factors associated with more collaboration are
132 also associated with less original and transformative types of
133 joint-work \cite{hill_remixing_2012}. In another study of Scratch
134 written with Monroy-Hernández and Kristina Olson, I show that this type
135 of superficial collaboration leads to negative reactions and community
136 displeasure \cite{hill_responses_2010}.
137
138 \begin{wrapfigure}{l}{2.6in}
139  \vspace{-1em}
140  \begin{centering}
141  \includegraphics[width=2.6in]{figures/frontpage_modified-topremix.jpg}
142   \caption{The front page of the Scratch online community where users
143     can share and collaborate on projects.}
144  \label{fig:scratchfrontpage}
145  \end{centering}
146  \vspace{-1.5em}
147 \end{wrapfigure}
148
149 This year, I am conducting a population-level analysis in a new
150 dataset I have created that includes 80,000 attempts at wikis (i.e.,
151 public, editable, websites similar to Wikipedia). In my first working
152 paper using this dataset, I consider inter-organizational competition
153 for volunteer labor and find little support for a widely cited
154 ecological model of collective action from sociology that treats
155 volunteer labor as a fixed and finite resource. Instead, I show that
156 contributions to different wikis on the same topic or theme are driven
157 primarily by environment-level changes in interest and that projects
158 can even benefit from complimentarities and synergies
159 \cite{hill_is_2012}.  By looking at failures, these studies provide
160 tests of several of the most influential theories of the conditions
161 for collective action, suggest important practical and theoretical
162 limitations to existing models, and point to previously untheorized
163 mechanisms.
164 \section{Reputation and Status}
165
166 Although empirical research comparing successful and unsuccessful peer
167 production projects has been rare, theories have been widespread. No
168 theory has been more influential than the suggestion that, in the
169 absence of pecuniary rewards, contributions to online public goods are
170 driven by the possibility of increased reputation and status for
171 contributors.
172
173 \begin{wrapfigure}{r}{0.3\textwidth}
174  \vspace{-1em}
175  \begin{centering}
176  \includegraphics[width=1.9in]{figures/barnstar_alone.png}
177  \caption{Image of a ``barnstar'' social award given by Wikipedia
178    contributors to each other to recognize positive contributions .}
179  \label{fig:barnstar}
180  \end{centering}
181  \vspace{-1em}
182 \end{wrapfigure}
183
184 In a study of status-based awards in Wikipedia called ``barnstars''
185 (see Figure \ref{fig:barnstar}) -- a collaboration with Aaron Shaw and
186 Yochai Benkler -- I provide an empirical test of an influential
187 status-based theory of collective action from sociology. Although the
188 study finds support for a widely hypothesized ``virtuous cycle'' in which
189 status rewards both cause and are caused by contributions, it also
190 finds that this effect is limited to a sub-population of Wikipedia
191 contributors -- ``signalers'' who show off their awards
192 \cite{hill_status_2012}. This result has broad implications for both
193 status-based theories of collective action as well the design of
194 reputation-based rewards.
195
196 In a mixed methods study of Scratch, written with a team at Microsoft
197 Research and nominated for best paper at the CHI 2011 conference
198 \cite{monroy-hernandez_computers_2011}, I present both a quantitative
199 analysis of a design change and in-depth interviews of users to
200 demonstrate how credit-giving is ineffective when it stems from an
201 automated system because systems fail to reinforce status-ordering
202 with credible human expressions of social deference and
203 gratitude. These studies suggest important limits to previous
204 theoretical work on status as a motivator for collective action, and
205 put forward a more nuanced theoretical model.
206
207 %\newpage
208 \section{Design-Driven Natural Experiments}
209
210 Although nearly all of my work has important implications for the
211 design of socio-technical systems, I have structured much of my work
212 around the evaluation of technological design changes. In several
213 papers, I treat design changes as ``natural experiments'' that
214 exogenously change the ways that social structure is enacted.
215
216 \begin{wrapfigure}{r}{0.25\textwidth}
217  \vspace{-1em}
218  \begin{centering}
219  \includegraphics[width=1.5in]{figures/lilypad.jpg}
220  \caption{A image of the LilyPad Arduino microcontroller.}
221  \label{fig:lilypad}
222  \end{centering}
223  \vspace{-1em}
224 \end{wrapfigure}
225
226 For example, to evaluate the impact of status-based incentives and
227 collaboration in Scratch, I use a regression discontinuity framework
228 to measure the causal effect of increased status for collaboration
229 \cite{hill_causal_2012}. I show that highlighting collaborative
230 projects on the Scratch web page (see the bottom of Figure
231 \ref{fig:scratchfrontpage}) resulted in more collaboration but also
232 caused a decrease in the amount of total effort exerted by
233 contributors. Speaking to fundamental sociological work in the
234 literature on collective action, I present evidence that this decrease
235 is driven by both an the influx of new contributors and a decrease in
236 the effort and contributions of established participants.
237
238 In other work with Leah Buechley, I have analyzed sales records of
239 hobbyist microcontrollers to argue that relatively simple design
240 changes in the \emph{LilyPad Arduino} -- a electronics toolkit
241 minimally re-designed for women and girls (see Figure
242 \ref{fig:lilypad}) -- led to large increases in the proportion of
243 women contributors and drastic shifts in the type of projects created
244 \cite{buechley_lilypad_2010}. I have also explored how technical
245 errors may be able to provide similar opportunities for analysis by
246 interrupting normal operation of a system and revealing internal
247 processes that are usually hidden \cite{hill_revealing_2010}. In
248 addition to the important theoretical findings in these studies, this
249 type of work represents an important methodological advance in that it
250 allows for stronger causal claims while also closing the gap between
251 theory and design.
252
253 % or changes in socio-technical systems describing responsibility for a piece of software can lead to an important impact in the type and structure of contributions in peer production \cite{michlmayr_quality_2003}
254
255 \section{Research Agenda}
256
257 My research agenda involves further exploration of the determinants of
258 collection action online -- especially using a series of large new
259 datasets I have recently assembled. I plan to both continue on this
260 research trajectory and to create new social and technical
261 infrastructure that will allow others researchers to join me in ``big
262 data'' observational research with active communities. This section
263 outlines some future directions I plan to explore.
264
265 \emph{Understanding the Relationship Between Collective Action and
266   Performance} -- My work has treated collective action and production
267 as ends in themselves and has largely avoided the consideration of
268 issues of performance, efficiency, and quality. Using my existing
269 datasets, I plan to compare the performance of collaborative
270 production to individually produced works to understand when
271 successful collection action leads to increased performance. For
272 example, in an analysis using data from Scratch which is currently under
273 review -- done in collaboration with Monroy-Hernández -- I show
274 important limitations of collaboration through remixing in regards to
275 project quality, particularly for more artistic or media-intensive
276 works \cite{hill_cost_2012}.
277
278 \emph{Integrated Theory of Design for Collective Action} -- My studies
279 of status and reputation provide a detailed understanding of the dynamics of
280 collection action in relation to one set of important predictors. In future
281 work, I plan to evaluate the effect of governance and different
282 systems of authority, framing, modularity and project complexity. In
283 the long term, I hope to offer a broad set of principles of
284 design for online collection action.
285
286 \emph{Toolkits for Experimental Social Design} -- My research has been
287 possible through personal relationships I have with a series of
288 organizations with large, active, online communities (e.g., the MIT
289 Media Lab and the Wikimedia Foundation). These organizations, like
290 many others, make design changes to the software that supports their
291 communities to encourage contributions and improve their users'
292 experiences. Most of the time, these organizations have very little
293 idea if these changes are effective. I plan to seek funding for, and
294 to create, a technical framework and a network of academic and
295 practitioner collaborators to facilitate well-designed natural
296 experiments by the hosts of large online communities and to share data
297 that allows for academic evaluation of these experiments.
298
299 Although I study cooperation, I also practice it. In graduate school,
300 I have collaborated with a large group of co-authors in many academic
301 departments. I intend to continue doing so. In sum, my research uses
302 design to contribute to social scientific theories of collective
303 action, and uses theories of collective action to influence
304 design. Although my research settings are online communities, I
305 believe my work has implications for a broad range of disciplines and
306 fields.
307
308 % bibliography here
309 \renewcommand{\bibsection}{\section{\bibname}\prebibhook}
310 \baselineskip 14.2pt
311 \bibliography{refs-processed}
312 \bibliographystyle{unsrt}
313
314 \end{document}
315

Benjamin Mako Hill || Want to submit a patch?