initial import into git of first draft
[bmh-research_statement] / research_statement.tex
1 \documentclass[10pt]{memoir}
2
3 % based on kieran healy's memoir modifications
4 \usepackage{mako-mem}
5 \chapterstyle{article-3}
6 \pagestyle{memo}
7
8 \usepackage{ucs}
9 \usepackage[utf8x]{inputenc}
10
11 \usepackage[T1]{fontenc}
12 \usepackage{textcomp}
13 \usepackage[garamond]{mathdesign}
14
15 \usepackage[letterpaper,left=1.2in,right=1.2in,top=1.2in,bottom=1.2in]{geometry}
16
17 % packages i use in essentially every document
18 \usepackage{graphicx}
19 \usepackage{wrapfig}
20 \usepackage{enumerate}
21
22 % packages i use in many documents but leave off by default
23 % \usepackage{amsmath, amsthm, amssymb}
24 % \usepackage{dcolumn}
25 % \usepackage{endfloat}
26
27 % import and customize urls
28 \usepackage[usenames,dvipsnames]{color}
29 \usepackage[breaklinks]{hyperref}
30
31 \hypersetup{colorlinks=true, linkcolor=Black, citecolor=Black, filecolor=Blue,
32     urlcolor=Blue, unicode=true}
33
34 % add bibliographic stuff 
35 % \usepackage[round]{natbib}
36 % \def\citepos#1{\citeauthor{#1}'s (\citeyear{#1})}
37 % \def\citespos#1{\citeauthor{#1}' (\citeyear{#1})}
38
39 % import vc stuff after running `make vc`: \input{vc} \pagestyle{kjhgit}
40
41 \begin{document}
42
43 \setlength{\parskip}{4.5pt}
44
45 \baselineskip 14.5pt
46
47 \title{Research Statement}
48 \author{Benjamin Mako Hill}
49
50 \maketitle
51
52 My research is focused on collective action in online communities and
53 seeks to understand why some attempts at collaborative production --
54 like Wikipedia and Linux -- build large volunteer communities while
55 the vast majority never attract even a second contributor. I am
56 particularly interested in how the design of communication and
57 information technologies shape social outcomes like the decision to
58 join a community or contribute to a public good. My research is deeply
59 interdisciplinary and lies at the intersection of sociology,
60 communication, and human-computer interaction. I combine data from
61 online communities that make failures of collective action newly
62 visible with ``big data'' research methods from software engineering
63 to answer fundamental social scientific questions.
64
65 Seeking to understand the determinants of collective action, my
66 research has been driven by three overlapping themes: (1)
67 population-level observational studies comparing failures to build
68 communities to the rare successful attempts; (2) attention to the role
69 of reputation and status in collective action; and (3) analyses of
70 design changes treated as ``natural experiments'' to build a deeper,
71 and often causal, understanding of social processes from observational
72 data. Almost all of my work incorporates at least two of these themes.
73
74 \section{Population-Level Observational Studies}
75
76 Although there have been many thousands of studies of online
77 collective action and peer production, the vast majority of these
78 studies have only considered successful projects like Wikipedia and
79 GNU/Linux.  The majority of research on collective action -- both
80 online and off -- has only considered projects that have successfully
81 mobilized contributors. In this sense, most previous analyses of
82 collection action have systematically selected on their dependent
83 variable. Most of my research treats projects as the unit of analysis
84 and mobilization as the dependent variable, comparing successful
85 examples of collective actions to failures.
86
87 % \begin{wrapfigure}{r}{0.4\textwidth}
88 %  \begin{centering}
89 %  \includegraphics[width=2.4in]{figures/wp_citations_by_year.png}
90 %  \caption{Number of published academic articles with ``wikipedia''
91 %  in title by year.}
92 %  \label{fig:wppapers}
93 %  \end{centering}
94 %\end{wrapfigure}
95
96 \begin{wrapfigure}{r}{2.6in}
97  \begin{centering}
98  \includegraphics[width=2.6in]{figures/scratch_screenshot_default.png}
99  \caption{A screenshot of the Scratch desktop programming environment
100    where users create animations and interactive games.}
101  \label{fig:scratchapp}
102  \end{centering}
103  \vspace{-2em}
104 \end{wrapfigure}
105
106
107 For example, in a working paper that is part of my dissertation, I
108 compare Wikipedia to seven attempts to create online collaborative
109 encyclopedia projects that were launched before Wikipedia
110 \cite{hill_almost_2012}. Using a inductive, grounded-theory based
111 analysis of founder interviews and archival data, I propose four
112 hypothesis for why Wikipedia built a large community while extremely
113 similar projects struggled to do so. Although the paper's methods
114 diverge from the quantitative, ``big data'' approach typical of most
115 of my work, the research question and strategy is representative.
116
117 I have also addressed this question in a series of quantitative
118 studies of the Scratch online community: a public website with a large
119 community of users who create, share, and remix interactive media. The
120 community is built around the Scratch programming environment: a
121 freely downloadable desktop application that allows amateur creators
122 to combine media with programming code (see Figure
123 \ref{fig:scratchapp}. Despite the fact that Scratch is a community
124 designed to promote collaboration through content remixing, only about
125 ten percent of Scratch projects will attract even a second
126 contributor.
127
128 \begin{wrapfigure}{l}{2.6in}
129  \begin{centering}
130  \includegraphics[width=2.6in]{figures/frontpage_modified-topremix.png}
131   \caption{The front page of the Scratch online community where users
132     can share and collaborate on projects.}
133  \label{fig:scratchfrontpage}
134  \end{centering}
135  \vspace{-2em}
136 \end{wrapfigure}
137
138 In one study, forthcoming in American Behavioral Scientist, I test
139 three of the most commonly cited theories associated with
140 ``generativity'' (i.e., qualities of technology or content that make
141 some works more fertile group for collaboration). I find some support
142 for previous theories but also find that, across the board, factors
143 associated with increased collaboration are associated with less
144 original and less transformative modes of joint-work
145 \cite{hill_remixing_2012}. In another published study using data from
146 Scratch, I show that more superficial collaboration leads to negative
147 reactions and displeasure in the community
148 \cite{hill_responses_2010}.
149
150 I am conducting a similar population based analysis in a new dataset I
151 have created with a population of 80,000 public attempts at ``wikis''
152 (i.e., public websites using the same infrastructure as Wikipedia). In
153 a working paper using this dataset, I consider inter-organizational
154 effects of competition for volunteer labor and find little support for
155 a widely cited ecological model of collective action from sociology
156 that treats volunteer labor as fixed and finite resource. Using data
157 on wikis hosted by both Wikia and the Wikimedia Foundation, I show
158 that contributions across peer production projects are driven by
159 environment-level changes in interest and that projects can even
160 benefit from complimentarities between similar projects
161 \cite{hill_is_2012}.
162
163 \section{Reputation and Status}
164
165 Although empirical research comparing successful and unsuccessful peer
166 projects has been rare, theories offering to explain the success of
167 collective action online have been widespread. No theory has been more
168 influential or widespread than the suggestion that, in the absence of
169 pecuniary rewards, engagement in collective action in online
170 communities is driven by the possibility of increased reputation and
171 status conferred upon contributors to an online public good.
172
173 \begin{wrapfigure}{r}{0.3\textwidth}
174  \vspace{-1em}
175  \begin{centering}
176  \includegraphics[width=1.9in]{figures/barnstar_alone.png}
177  \caption{Image of a ``barnstar'' social award given by Wikipedia
178    contributors to each other to recognize positive contributions .}
179  \label{fig:barnstar}
180  \end{centering}
181  \vspace{-1em}
182 \end{wrapfigure}
183
184 In a study of status-based awards in Wikipedia called ``barnstars''
185 (see Figure \ref{fig:barnstar}) that I will be submitting to a major
186 sociology journal by the end of this year, I provide an empirical test
187 of an influential status-based theory of collective action from
188 sociology. Although the study finds support for the widely
189 hypothesized virtuous cycle of status rewarding active contributors,
190 it also finds that these effects are limited to a sub-population of
191 Wikipedia contributors -- i.e., those who show their awards off to
192 others in virtual trophy cases \cite{hill_status_2012}. This result
193 has broad implications for both status-based theories of collective
194 action as well the design of reputation-based reward systems.
195
196 In another study of Scratch, nominated for best paper at the CHI 2011
197 conference \cite{monroy-hernandez_computers_2011}, I paired a
198 quantitative analysis of a design change with in-depth interviews of
199 users to demonstrate how credit-giving is ineffective when it stems
200 from an automated system because the system fails to reinforce
201 status-ordering through credible human expressions of social deference
202 and gratitude.
203
204 \section{Design-Driven Natural Experiments}
205
206 \begin{wrapfigure}{r}{0.25\textwidth}
207  \begin{centering}
208  \includegraphics[width=1.5in]{figures/lilypad.png}
209  \caption{A image of the LilyPad Arduino microcontroller.}
210  \label{fig:lilypad}
211  \end{centering}
212 \end{wrapfigure}
213
214 Although nearly all of my work has important implications for the
215 design of socio-technical systems, I have structured much of my work
216 around the evaluation of design interventions. In several papers, I
217 treat design changes in technologies as ``natural experiments'' that
218 exogenously change the ways that social structure is enacted in order
219 to both build causal understanding from field data and to tighten the
220 distance between theories and and design.
221
222 For example, to evaluate the impact of status-based incentives and
223 collaboration in Scratch, I use a regression discontinuity framework
224 to measure the causal effect of increased status for collaboration in
225 Scratch \cite{hill_causal_2012}. In that study, which I am preparing
226 for submission to a communication journal this fall, I show that the
227 highlighting the work of the authors of collaborative projects on the
228 Scratch web page (see the bottom of Figure \ref{fig:scratchfrontpage})
229 resulted in more collaboration but also caused a decrease in the
230 amount of total effort exerted by contributors. Speaking to
231 fundamental sociological work in the literature on collective action,
232 I present evidence that this decrease is driven by both an the influx
233 of new contributors and a decrease in the effort and contributions of
234 established contributors.
235
236 In other papers, I have helped analyze sales records of hobbyists
237 microcontrollers to suggest that relatively simple design changes in
238 the \emph{LilyPad Arduino} -- a electronics toolkit minimally
239 re-designed for women and girls (see Figure \ref{fig:lilypad}) -- can
240 lead to large increases in the proportion of women contributors
241 through important shifts in the type of projects created
242 \cite{buechley_lilypad_2010}. In other work, I have explored how
243 technical errors may be able to provide similar opportunities for
244 analysis \cite{hill_revealing_2010}.
245
246 % or changes in socio-technical systems describing responsibility for a piece of software can lead to an important impact in the type and structure of contributions in peer production \cite{michlmayr_quality_2003}
247
248 \section{Research Agenda}
249
250 My research agenda involves further exploration of the determinants of
251 collection action online -- especially using a series of large new
252 datasets I have built in my dissertation research. I plan to both
253 continue this research trajectory and to create new social and
254 technical infrastructure that will allow others researchers to join me
255 in the type ``big data'' observational research in active communities
256 that my research involves. This section outlines some future
257 directions I plan to explore.
258
259 \emph{Toolkits for Experimental Social Design} -- My research has been
260 possible through relationships I have with a series of organizations
261 with large active online communities (e.g., the MIT Media Lab and the
262 Wikimedia Foundation). These organizations, like many others, make
263 design changes to the software that supports their communities to
264 encourage contributions and improve aspects of their users'
265 experiences. Most of the time, these organizations have very little
266 idea if these changes work. I plan to build on my own experience
267 evaluating natural experiments in online communities to create a
268 technical framework, and a network of academic and practitioner
269 collaborators, to facilitate well-designed experiments by the hosts of
270 large online communities and a system for data sharing that allows for
271 academic evaluation of these experiments.
272
273 \emph{Understanding the Relationship Between Collective Action and
274   Performance} -- My work has treated collective action and production
275 as ends in themselves and has largely avoided the consideration of
276 issues of performance, efficiency, or quality. Using my existing
277 datasets, I will compare the performance of collaborative production
278 to individually produced works to understand when successful
279 collection action leads to higher performance or quality. In a
280 manuscript currently under review using data from Scratch, I show
281 important limitations of collaboration in remixing quality,
282 particularly in regards to more artistic or media-intensive projects
283 \cite{hill_cost_2012}. I will further explore this direction in future
284 work.
285
286 \emph{Integrated Theory of Design for Collective Action} --
287 My studies of status provide a detailed understanding of the dynamics
288 of collection action in relation to one important independent
289 variable. In future work, I plan to evaluate the effect of governance
290 and different systems of authority, framing, modularity and project
291 complexity. In the long term, I hope to work toward a broad set of
292 principles of design for collection action and community.
293
294 In graduate school, I have been fortunate to collaborate with many
295 co-authors in many academic departments and I intend to continue this
296 tradition going forward. In sum, my research uses design to contribute
297 to social scientific theories of collective action, and using theories
298 of collective action to influence design and offers implications and
299 opportunities for a broad range of disciplines and fields.
300
301 % bibliography here
302 \renewcommand{\bibsection}{\section{\bibname}\prebibhook}
303 \baselineskip 14.2pt
304 \bibliography{refs-processed}
305 \bibliographystyle{unsrt}
306
307 \end{document}
308

Benjamin Mako Hill || Want to submit a patch?