4f85bf68481be6d3d58b86b79227e23b7c350c13
[state_of_wikimedia_research_2015] / 20150717-wikimania_research.tex
1 \documentclass[xcolor=dvipsnames]{beamer}
2
3 % set up the file to create notes in the output PDFs
4 \usepackage{pgfpages}
5 \input{notes.config}
6
7 \renewcommand{\rmdefault}{ugm}
8 \usepackage[garamond]{mathdesign}
9
10 \renewcommand{\sfdefault}{phv}
11 \usepackage{relsize}
12
13 \usepackage{ucs}
14 \usepackage[utf8x]{inputenc}
15 \usepackage[T1]{fontenc}
16 \usepackage{textcomp}
17
18 % add tikz and a bunch of tikz foo
19 \usepackage{tikz}
20 \usetikzlibrary{shapes,shapes.misc,backgrounds,fit,positioning}
21 \tikzstyle{every picture}+=[overlay,remember picture]
22
23 % add functions to circle parts of slides (e.g., in tables)
24 \newcommand\marktopleft[1]{\tikz \node (marker-#1-a) at (0,1.5ex) {};}
25 \newcommand\markbottomright[1]{%
26   \tikz{\node (marker-#1-b) at (0,0) {};}
27   \tikz[dashed,inner sep=3pt]{\node[violet!75,ultra thick,draw,rounded rectangle,fit=(marker-#1-a.center) (marker-#1-b.center)] {};}}
28
29 % DEPRECATED function to build a huge centered dropshadow
30 \newcommand\dropshadow[3]{%
31   \node[black!30!white] at (#1+0.1,#2-0.1) {
32     \scalebox{2}{\Huge \textbf{#3}}
33   };
34   \node at (#1,#2) {
35     \scalebox{2}{\Huge \e{#3}}
36   };
37 }
38
39 % create an empty quotetxt so we can reuse it
40 \newcommand{\quotetxt}{}
41
42 % more flexible non-tikz alternative with no dropshadow 
43 \newlength{\centertxtlen}
44 \makeatletter
45 \newcommand\centertext[2]{%
46   \setlength{\centertxtlen}{#1}%
47   \setlength{\centertxtlen}{0.48\centertxtlen}%
48   {\centering
49     \fontsize{#1}{2\centertxtlen}\selectfont
50     \e{#2}
51
52   }
53 }
54
55
56 % add function to stop numbering appendix slides
57 \newcommand{\backupbegin}{
58    \newcounter{framenumberappendix}
59    \setcounter{framenumberappendix}{\value{framenumber}}
60 }
61 \newcommand{\backupend}{
62    \addtocounter{framenumberappendix}{-\value{framenumber}}
63    \addtocounter{framenumber}{\value{framenumberappendix}} 
64 }
65
66 % packages i use in essentially every document
67 \usepackage{graphicx}
68 \usepackage{url}
69 % \usepackage{dcolumn}
70 % \usepackage{booktabs}
71
72 % replace footnotes with symbols instead of numbers
73 \renewcommand*{\thefootnote}{\fnsymbol{footnote}}
74 \usepackage{perpage}
75 \MakePerPage{footnote}
76
77 %% BEAMER THEME STUFF
78 \usetheme[pageofpages=/,% String used between the current page and the
79                          % total page count.
80           bullet=default,% Use circles instead of squares for bullets.
81           titleline=false,% Show a line below the frame title.
82           alternativetitlepage=true,% Use the fancy title page.
83           titlepagelogo=figures/logo.pdf,% Logo for the first page.
84           %watermark=watermark-polito,% Watermark used in every page.
85           watermarkheight=100px,% Height of the watermark.
86           watermarkheightmult=4,% The watermark image is 4 times bigger
87                                 % than watermarkheight.
88           ]{Torino}
89
90 \usecolortheme{mako}
91 \useinnertheme{rectangles}
92 %\setbeamertemplate{blocks}[rounded][]
93 \setbeamercolor{block title}{bg=makopurple3, fg=White}
94
95 \setbeamertemplate{items}[default] 
96 \setbeamertemplate{blocks}[shadow=true] 
97
98 \usepackage{tcolorbox}
99 % These options will be applied to all `tcolorboxes`
100 \tcbset{%
101     noparskip,
102     colback=makopurple5, %background color of the box
103     colframe=makopurple1, %color of frame and title background
104     coltext=black, %color of body text
105     coltitle=white, %color of title text 
106     arc=0em,
107     left=0.1em,
108     right=0.1em,
109     fonttitle=\bfseries,
110     alerted/.style={coltitle=red, 
111                      colframe=gray!40},
112     example/.style={coltitle=black, 
113                      colframe=green!20,             
114                      colback=green!5},
115     }
116
117
118 %\useoutertheme{infolines}
119 %\usepackage[breaklinks]{hyperref}
120
121 \hypersetup{colorlinks=true, linkcolor=Black, citecolor=Black, filecolor=makopurple1,
122     urlcolor=Plum, unicode=true}
123
124 % create a boldface version of the header
125 \setbeamerfont{frametitle}{series=\bfseries}
126 \setbeamerfont{title}{series=\bfseries}
127
128 % tweak the beamer font to make it a bit lists a bit smaller
129 \setbeamerfont*{itemize/enumerate body}{size=\small}
130 \setbeamerfont*{itemize/enumerate subbody}{size=\footnotesize}
131 \setbeamerfont*{itemize/enumerate subsubbody}{size=\footnotesize}
132
133 % indent the margins of the itemize lists a little bit
134 \setlength{\leftmargin}{0pt}
135 \setlength{\leftmargini}{0.7cm}
136 \setlength{\leftmarginii}{0.7cm}
137
138 % create a new \e{} command to make things purple and bold
139 \newcommand{\e}[1]{\textcolor{makopurple1}{\textbf{#1}}}
140
141 % remove the nagivation symbols
142 \setbeamertemplate{navigation symbols}{}
143
144 \title{Presentation Title}
145 % \subtitle{Presentation Subtitle}
146 \author[Benj. Mako Hill]{\textbf{Benjamin Mako Hill}\\ makohill@uw.edu}
147
148 \institute[UW/Harvard]{\textbf{University of Washington}\\
149   Department of Communication\\
150   \emph{Assistant Professor}\\
151   \hspace{1pt}\\
152   \textbf{Harvard University}\\
153   Berkman Center for Internet and Society\\
154   \emph{Resident Fellow}}
155
156 \date{December 2, 1980}
157
158 \newcommand{\credit}[1]{%
159   \tikz[overlay]{\node at (current page.south east)
160     [anchor=south east,yshift=1.1em,xshift=0.35em]
161     {\smaller \smaller {[}#1{]}};}}
162
163 \begin{document}
164
165 % remove some of the space in the itemize to make it quite compact
166 \let\olditemize\itemize
167 \renewcommand\itemize{\olditemize\itemsep-1pt}
168
169 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
170 \section{Introduction}
171 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
172
173 %% SLIDE: Title Slide
174 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
175 \begin{frame}[plain]
176
177   \begin{tikzpicture}
178     \node at (current page.center) [xshift=-3.5cm, yshift=0.5cm, opacity=0.4]
179       {\includegraphics[height=\paperheight]{figures/wikimedia_projects.png}};
180
181
182     \node at (current page.south east)
183     [anchor=south east,text width=1.8\paperwidth,align=right,color=black]
184     {
185       {\spaceskip 0.3em%
186         \fontsize{2.5em}{2.5em}
187         \selectfont {\bf \color{makopurple4} The State of Wikimedia\\
188           Research: 2014-2015} \par}
189
190       \vspace{1em}
191
192       {\spaceskip 0.3em%
193         \fontsize{2.0em}{2.1em}
194         \selectfont {\bf \color{black} Benjamin Mako Hill\\
195           Tilman Bayer\\
196           Aaron Shaw\\
197           Wikimania 2015, Mexico City\\
198           July 17, 2015} \par}
199
200     };
201   \end{tikzpicture}
202
203 % Removed to accommodate Tilman's setup  
204 %  \input{vc}
205 %
206 %  \tikz[overlay,shift=(current page.south west)]{\node [xshift=5.6em,yshift=0.5em]{\colorbox{makopurple1}{\color{white} \tt \smaller \smaller \smaller revision:\ \VCRevision\  (\VCDateTEX)}};}
207
208   \note{I've been doing this for many years. I started in 2008 and
209     have done this almost every single year since.
210
211     This began as an excuse for me to make sure I was up to date on
212     Wikimedia Research.}
213
214 \end{frame}
215
216 %% SLIDE: Anecdote from Wikimania 2008
217 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
218 \renewcommand{\quotetxt}{``This talk will try to [provide] a quick
219   tour – a literature review in the scholarly parlance – of the last
220   year's academic landscape around Wikimedia and its projects geared
221   at non-academic editors and readers. It will try to categorize,
222   distill, and describe, from a birds eye view, the academic landscape
223   as it is shaping up around
224   our project.''\\
225   \hfill – \e{From my Wikimania 2008 Submission}}
226
227 \begin{frame}
228
229   {\smaller \quotetxt}
230
231   \pause
232   \includegraphics[width=\textwidth]{figures/google_scholar_result.png}
233
234   \pause
235   \tikz{\draw (current page.center) [xshift=-2.1cm, yshift=0.9cm, color=red]
236     ellipse (1.5cm and 0.5cm);}
237
238   \note<1>{Back in Wikimania 2008, I set out to run a session at
239     Wikimania that would provide a comprehensive literature review of
240     articles in Wikipedia published in the last year.
241
242     \begin{quote}
243       \quotetxt
244     \end{quote}
245
246     Then, about two weeks before Wikimania, I did the scholar search
247     so I could build the literature.}
248
249   \note<2->{I tried to import the whole list into Zotero and managed
250     to get banned for abusing the Google Scholar because they thought
251     that no human being could realistically consume the amount of
252     material published on Wikipedia that year.
253
254     So anyway, I had a 45 minute talk so it worked out to 3.45 seconds
255     to per paper...
256
257     And believe it or not, this year is even bigger.
258  
259     And my talk is even shorter.}
260
261 \end{frame}
262
263 %% SLIDE: Citations Per Year
264 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
265 \begin{frame}
266
267   \includegraphics[width=\textwidth]{figures/citations_by_year.pdf}
268
269   \centering
270
271   {\smaller \emph{Number of citation, per year, with the term
272       “wikipedia” in the title.\\
273       (Source: Google scholar results. Accessed: 2013-08-06)}}
274
275   \note{Academics have written \e{a lot} of papers about
276     Wikipedia. There are more than 500 papers published about
277     Wikipedia each year and although we've reached and moved past a
278     peak it seems, it's not slowing by much.}
279
280 \end{frame}
281
282 \begin{frame}
283
284   \begin{itemize}
285     \larger \larger
286   \item \e{2968} Wikipedia-related publications in the Scopus database
287     as of November 2013
288
289   \item \e{160} recent publications reviewed or mentioned in the 12 issues
290     of the Wikimedia Research Newsletter August 2013-July 2014.
291   \end{itemize}
292
293 \end{frame}
294
295 %% SLIDE: My Scope Conditions
296 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
297 \begin{frame}
298
299   \includegraphics[width=\textwidth]{figures/multiple_issues.png}
300
301   \larger \larger
302   In selecting papers for this session, the goal is always to choose
303   examples of work that:
304
305   \begin{itemize}
306   \larger \larger
307   \item Represent \e{important themes} from Wikipedia in the last year.
308   \item Research that is likely to be of \e{interest} to Wikimedians.
309   \item Research by people who are \e{not at Wikimania}.
310   \end{itemize}
311
312   \note{This is my disclaimer slide...
313
314   Within these goals, the selections are \e{incomplete}, and \e{wrong}.}
315 \end{frame}
316
317 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
318 \section{Paper Summaries}
319 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
320
321 % \subsection{Event Prediction}
322
323 % \begin{frame}
324 %   \centertext{6em}{Event Prediction}
325
326 %   \note{Mako
327
328 %     This was the year that studies of readership of Wikipedia really
329 %     blossomed. People figured out how to use the view data. Much of
330 %     what they used it for was prediction.}
331 % \end{frame}
332
333 % \begin{frame}
334   
335 %   \frametitle{Wikipedia Viewership and Flu Prediction}
336
337 %   \larger \larger McIver, David J., and John
338 %   S. Brownstein. ``\e{Wikipedia Usage Estimates Prevalence of
339 %     Influenza-Like Illness in the United States in Near Real-Time}.''
340 %   PLoS Comput Biol 10, no. 4 (April 17, 2014):
341 %   e1003581. \href{http://dx.doi.org/10.1371/journal.pcbi.1003581}{doi:10.1371/journal.pcbi.1003581}.
342
343 % \end{frame}
344
345 % \begin{frame}
346
347 %   \frametitle{Wikipedia Viewership and Flu Prediction: Motivation}
348
349 %   \begin{itemize}
350 %     \larger \larger
351 %   \item \e{Google Flu Trends} uses search engine queries to try to
352 %     predict influenza epidemics more quickly than traditional methods.
353 %   \item ..but it has been criticized as being biased (e.g., by media coverage).
354 %   \item WP is freely available and viewership data is free, unlike
355 %     Google which is proprietary.
356
357 %   \end{itemize}
358
359 %   \note{2009 H1N1 Swine Flu broke GFT.}
360 % \end{frame}
361
362 % \begin{frame}
363
364 %   \frametitle{Wikipedia Viewership and Flu Prediction: Methods}
365
366 %   \begin{itemize}
367 %   \larger \larger \larger
368 %   \item Measure traffic to flu related articles on Wikipedia
369 %   \item Compare to the ``gold standard'' data from the Center for
370 %     Disease Control (CDC)
371 %   \end{itemize}
372
373 % \end{frame}
374
375 % \begin{frame}
376 %   \frametitle{Wikipedia Viewership and Flu Prediction: Results}
377
378 %   \centering
379 %   \includegraphics[width=\textwidth]{figures/flu.png}
380
381 % \note{\begin{itemize}
382 %   \larger \larger
383
384 %   \item Wikipedia better than Google at predicting peak flu weeks.
385 %   \item Wikipedia better at predicting relative influenza rates.
386 %   \end{itemize}}
387
388 % \end{frame}
389
390
391 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
392 \section{Conclusion}
393 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
394
395 %% SLIDE: Other Resources
396 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
397 \begin{frame}{More Resources}
398
399   \begin{itemize}
400     \larger \larger
401   \item \e{Wikimedia Research Newsletter} [[:meta:Research:Newsletter]]
402   \item \e{WikiSym} (Later this month in Berlin!)
403   \item \e{WikiPapers Repository} [http://wikipapers.referata.com]
404   \item \e{Much More}
405   \end{itemize}
406
407   {\centering 
408     \includegraphics[width=0.25\textwidth]{figures/Wikimedia_Research_Newsletter_Logo.png}
409
410   }
411
412   \note{Those are my six exemplary studies from the past year. 
413
414     There has been just tons and tons of work in this area. Trying to
415     talk about this in 20 minutes strikes me as increasingly crazy
416     every year I try to do it.
417
418     The most important source, now going for a couple years, is the
419     Wikimedia Research Newsletter which is published monthly in the (English)
420     Signpost and syndicated on the Wikimedia Research.
421
422     But there are other resources as well. And I encourage you to get
423     involved.}
424
425 \end{frame}
426
427 \subsection{Meta-Analyses}
428
429 \begin{frame}
430
431   \frametitle{Meta-Analyses}
432
433   \begin{itemize}
434
435     \larger \larger
436
437   \item Okoli et al.,
438     \href{https://spectrum.library.concordia.ca/978618/}{``The sum of
439       all human knowledge'': a systematic review of scholarly research
440       on the content of Wikipedia}.
441
442   \item Bar-Ilan and Aharony,
443     \href{http://dl.acm.org/citation.cfm?doid=2615569.2615643}{Twelve
444       years of Wikipedia research}.
445     
446   \item Taraborelli. \href{https://meta.wikimedia.org/wiki/Research:Newsletter/2013/August\#Keynote\_on\_applicable\_Wikipedia\_research}{Keynote
447       on Wikipedia Research}. OpenSym 2013. Hong Kong.
448
449   \item Benkler, Shaw, and Hill,
450     \href{http://mako.cc/academic/benkler\_shaw\_hill-peer\_production\_ci.pdf}{Peer
451       Production: A Modality of Collective Intelligence}.
452
453   \end{itemize}
454
455 \end{frame}
456
457 \end{document}
458

Benjamin Mako Hill || Want to submit a patch?