782d0690b4caec488cc8e227065ab50f662aa121
[state_of_wikimedia_research_2015] / 20150717-wikimania_research.tex
1 \documentclass[xcolor=dvipsnames]{beamer}
2
3 % set up the file to create notes in the output PDFs
4 \usepackage{pgfpages}
5 \input{notes.config}
6
7 \renewcommand{\rmdefault}{ugm}
8 \usepackage[garamond]{mathdesign}
9
10 \renewcommand{\sfdefault}{phv}
11 \usepackage{relsize}
12
13 \usepackage{ucs}
14 \usepackage[utf8x]{inputenc}
15 \usepackage[T1]{fontenc}
16 \usepackage{textcomp}
17
18 % add tikz and a bunch of tikz foo
19 \usepackage{tikz}
20 \usetikzlibrary{shapes,shapes.misc,backgrounds,fit,positioning}
21 \tikzstyle{every picture}+=[overlay,remember picture]
22
23 % add functions to circle parts of slides (e.g., in tables)
24 \newcommand\marktopleft[1]{\tikz \node (marker-#1-a) at (0,1.5ex) {};}
25 \newcommand\markbottomright[1]{%
26   \tikz{\node (marker-#1-b) at (0,0) {};}
27   \tikz[dashed,inner sep=3pt]{\node[violet!75,ultra thick,draw,rounded rectangle,fit=(marker-#1-a.center) (marker-#1-b.center)] {};}}
28
29 % DEPRECATED function to build a huge centered dropshadow
30 \newcommand\dropshadow[3]{%
31   \node[black!30!white] at (#1+0.1,#2-0.1) {
32     \scalebox{2}{\Huge \textbf{#3}}
33   };
34   \node at (#1,#2) {
35     \scalebox{2}{\Huge \e{#3}}
36   };
37 }
38
39 % create an empty quotetxt so we can reuse it
40 \newcommand{\quotetxt}{}
41
42 % more flexible non-tikz alternative with no dropshadow 
43 \newlength{\centertxtlen}
44 \makeatletter
45 \newcommand\centertext[2]{%
46   \setlength{\centertxtlen}{#1}%
47   \setlength{\centertxtlen}{0.48\centertxtlen}%
48   {\centering
49     \fontsize{#1}{2\centertxtlen}\selectfont
50     \e{#2}
51
52   }
53 }
54
55
56 % add function to stop numbering appendix slides
57 \newcommand{\backupbegin}{
58    \newcounter{framenumberappendix}
59    \setcounter{framenumberappendix}{\value{framenumber}}
60 }
61 \newcommand{\backupend}{
62    \addtocounter{framenumberappendix}{-\value{framenumber}}
63    \addtocounter{framenumber}{\value{framenumberappendix}} 
64 }
65
66 % packages i use in essentially every document
67 \usepackage{graphicx}
68 \usepackage{url}
69 % \usepackage{dcolumn}
70 % \usepackage{booktabs}
71
72 % replace footnotes with symbols instead of numbers
73 \renewcommand*{\thefootnote}{\fnsymbol{footnote}}
74 \usepackage{perpage}
75 \MakePerPage{footnote}
76
77 %% BEAMER THEME STUFF
78 \usetheme[pageofpages=/,% String used between the current page and the
79                          % total page count.
80           bullet=default,% Use circles instead of squares for bullets.
81           titleline=false,% Show a line below the frame title.
82           alternativetitlepage=true,% Use the fancy title page.
83           titlepagelogo=figures/logo.pdf,% Logo for the first page.
84           %watermark=watermark-polito,% Watermark used in every page.
85           watermarkheight=100px,% Height of the watermark.
86           watermarkheightmult=4,% The watermark image is 4 times bigger
87                                 % than watermarkheight.
88           ]{Torino}
89
90 \usecolortheme{mako}
91 \useinnertheme{rectangles}
92 %\setbeamertemplate{blocks}[rounded][]
93 \setbeamercolor{block title}{bg=makopurple3, fg=White}
94
95 \setbeamertemplate{items}[default] 
96 \setbeamertemplate{blocks}[shadow=true] 
97
98 \usepackage{tcolorbox}
99 % These options will be applied to all `tcolorboxes`
100 \tcbset{%
101     noparskip,
102     colback=makopurple5, %background color of the box
103     colframe=makopurple1, %color of frame and title background
104     coltext=black, %color of body text
105     coltitle=white, %color of title text 
106     arc=0em,
107     left=0.1em,
108     right=0.1em,
109     fonttitle=\bfseries,
110     alerted/.style={coltitle=red, 
111                      colframe=gray!40},
112     example/.style={coltitle=black, 
113                      colframe=green!20,             
114                      colback=green!5},
115     }
116
117
118 %\useoutertheme{infolines}
119 %\usepackage[breaklinks]{hyperref}
120
121 \hypersetup{colorlinks=true, linkcolor=Black, citecolor=Black, filecolor=makopurple1,
122     urlcolor=Plum, unicode=true}
123
124 % create a boldface version of the header
125 \setbeamerfont{frametitle}{series=\bfseries}
126 \setbeamerfont{title}{series=\bfseries}
127
128 % tweak the beamer font to make it a bit lists a bit smaller
129 \setbeamerfont*{itemize/enumerate body}{size=\small}
130 \setbeamerfont*{itemize/enumerate subbody}{size=\footnotesize}
131 \setbeamerfont*{itemize/enumerate subsubbody}{size=\footnotesize}
132
133 % indent the margins of the itemize lists a little bit
134 \setlength{\leftmargin}{0pt}
135 \setlength{\leftmargini}{0.7cm}
136 \setlength{\leftmarginii}{0.7cm}
137
138 % create a new \e{} command to make things purple and bold
139 \newcommand{\e}[1]{\textcolor{makopurple1}{\textbf{#1}}}
140
141 % remove the nagivation symbols
142 \setbeamertemplate{navigation symbols}{}
143
144 \title{Presentation Title}
145 % \subtitle{Presentation Subtitle}
146 \author[Benj. Mako Hill]{\textbf{Benjamin Mako Hill}\\ makohill@uw.edu}
147
148 \institute[UW/Harvard]{\textbf{University of Washington}\\
149   Department of Communication\\
150   \emph{Assistant Professor}\\
151   \hspace{1pt}\\
152   \textbf{Harvard University}\\
153   Berkman Center for Internet and Society\\
154   \emph{Resident Fellow}}
155
156 \date{December 2, 1980}
157
158 \newcommand{\credit}[1]{%
159   \tikz[overlay]{\node at (current page.south east)
160     [anchor=south east,yshift=1.1em,xshift=0.35em]
161     {\smaller \smaller {[}#1{]}};}}
162
163 \begin{document}
164
165 % remove some of the space in the itemize to make it quite compact
166 \let\olditemize\itemize
167 \renewcommand\itemize{\olditemize\itemsep-1pt}
168
169 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
170 \section{Introduction}
171 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
172
173 %% SLIDE: Title Slide
174 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
175 \begin{frame}[plain]
176
177   \begin{tikzpicture}
178     \node at (current page.center) [xshift=-3.5cm, yshift=0.5cm, opacity=0.4]
179       {\includegraphics[height=\paperheight]{figures/wikimedia_projects.png}};
180
181
182     \node at (current page.south east)
183     [anchor=south east,text width=1.8\paperwidth,align=right,color=black]
184     {
185       {\spaceskip 0.3em%
186         \fontsize{2.5em}{2.5em}
187         \selectfont {\bf \color{makopurple4} The State of Wikimedia\\
188           Research: 2014-2015} \par}
189
190       \vspace{1em}
191
192       {\spaceskip 0.3em%
193         \fontsize{2.0em}{2.1em}
194         \selectfont {\bf \color{black} Benjamin Mako Hill\\
195           Tilman Bayer\\
196           Aaron Shaw\\
197           Wikimania 2015, Mexico City\\
198           July 17, 2015} \par}
199
200     };
201   \end{tikzpicture}
202
203 % Removed to accommodate Tilman's setup  
204 %  \input{vc}
205 %
206 %  \tikz[overlay,shift=(current page.south west)]{\node [xshift=5.6em,yshift=0.5em]{\colorbox{makopurple1}{\color{white} \tt \smaller \smaller \smaller revision:\ \VCRevision\  (\VCDateTEX)}};}
207
208   \note{I've been doing this for many years. I started in 2008 and
209     have done this almost every single year since.
210
211     This began as an excuse for me to make sure I was up to date on
212     Wikimedia Research.}
213
214 \end{frame}
215
216 %% SLIDE: Anecdote from Wikimania 2008
217 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
218 \renewcommand{\quotetxt}{``This talk will try to [provide] a quick
219   tour – a literature review in the scholarly parlance – of the last
220   year's academic landscape around Wikimedia and its projects geared
221   at non-academic editors and readers. It will try to categorize,
222   distill, and describe, from a birds eye view, the academic landscape
223   as it is shaping up around
224   our project.''\\
225   \hfill – \e{From my Wikimania 2008 Submission}}
226
227 \begin{frame}
228
229   {\smaller \quotetxt}
230
231   \pause
232   \includegraphics[width=\textwidth]{figures/google_scholar_result.png}
233
234   \pause
235   \tikz{\draw (current page.center) [xshift=-2.1cm, yshift=0.9cm, color=red]
236     ellipse (1.5cm and 0.5cm);}
237
238   \note<1>{Back in Wikimania 2008, I set out to run a session at
239     Wikimania that would provide a comprehensive literature review of
240     articles in Wikipedia published in the last year.
241
242     \begin{quote}
243       \quotetxt
244     \end{quote}
245
246     Then, about two weeks before Wikimania, I did the scholar search
247     so I could build the literature.}
248
249   \note<2->{I tried to import the whole list into Zotero and managed
250     to get banned for abusing the Google Scholar because they thought
251     that no human being could realistically consume the amount of
252     material published on Wikipedia that year.
253
254     So anyway, I had a 45 minute talk so it worked out to 3.45 seconds
255     to per paper...
256
257     And believe it or not, this year is even bigger.
258  
259     And my talk is even shorter.}
260
261 \end{frame}
262
263 %% SLIDE: Citations Per Year
264 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
265 \begin{frame}
266
267   \includegraphics[width=\textwidth]{figures/citations_by_year.pdf}
268
269   \centering
270
271   {\smaller \emph{Number of citation, per year, with the term
272       “wikipedia” in the title.\\
273       (Source: Google scholar results. Accessed: 2013-08-06)}}
274
275   \note{Academics have written \e{a lot} of papers about
276     Wikipedia. There are more than 500 papers published about
277     Wikipedia each year and although we've reached and moved past a
278     peak it seems, it's not slowing by much.}
279
280 \end{frame}
281
282 \begin{frame}
283
284   \begin{itemize}
285     \larger \larger
286   \item \e{2968} Wikipedia-related publications in the Scopus database
287     as of November 2013
288
289   \item \e{191} recent publications reviewed or mentioned in the 12 issues
290     of the Wikimedia Research Newsletter from July 2014 to June 2015.
291   \end{itemize}
292
293 \end{frame}
294
295 %% SLIDE: My Scope Conditions
296 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
297 \begin{frame}
298
299   \includegraphics[width=\textwidth]{figures/multiple_issues.png}
300
301   \larger \larger
302   In selecting papers for this session, the goal is always to choose
303   examples of work that:
304
305   \begin{itemize}
306   \larger \larger
307   \item Represent \e{important themes} from Wikipedia in the last year.
308   \item Research that is likely to be of \e{interest} to Wikimedians.
309   \item Research by people who are \e{not at Wikimania}.
310   \item \ldots with a bias towards \e{peer-reviewed} publications 
311   \end{itemize}
312
313   \note{This is my disclaimer slide...
314
315   Within these goals, the selections are \e{incomplete}, and \e{wrong}.}
316 \end{frame}
317
318 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
319 \section{Paper Summaries}
320 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
321
322 \begin{frame}
323   \centertext{6em}{Wikipedia as a Source of Data}
324
325   \note{Mako}
326 \end{frame}
327
328 \begin{frame}
329
330   \frametitle{Wikipedia as a source of data}
331
332   \larger \larger Ronen, S., Gonçalves, B., Hu, K. Z., Vespignani, A.,
333   Pinker, S., \& Hidalgo, C. A. (2014). \e{Links that speak: The
334     global language network and its association with global
335     fame}. Proceedings of the National Academy of Sciences, 111(52),
336   E5616—E5622. \href{http://doi.org/10.1073/pnas.1410931111}{doi:10.1073/pnas.1410931111}
337
338 \end{frame}
339
340 \begin{frame}
341   \frametitle{How to measure the global influence of languages?}
342
343   \larger \larger
344
345   \e{Traditional} methods rely on:
346
347   \begin{itemize}
348     \larger \larger
349   \item \e{Population} of speakers
350   \item \e{Income} or political power of speakers
351   \end{itemize}
352
353   Paper presents \e{new network method} based on measuring
354   \e{co-speakers} of languages in several data sources including
355   Wikipedia.
356
357 \end{frame}
358
359 \begin{frame}
360   \frametitle{Wikipedia as a source of data: Ronen et al.}
361
362   \includegraphics[width=\textwidth]{figures/ronen_fig1.png}
363
364   \note{Two languages are connected when users that edit an article in
365     one Wikipedia language edition are significantly more likely to
366     also edit an article in the edition of the other language.
367
368     If an editor of Spanish is also likely to edit Galician, we'll
369     call those languages connected.}
370 \end{frame}
371
372 \begin{frame}
373   \frametitle{Wikipedia as a source of data: Ronen et al.}
374
375   \includegraphics[width=\textwidth]{figures/ronen_people.png}
376
377   \note{\begin{itemize}
378     \item The number of people per language (born 1800–1950) with
379       articles in at least 26 Wikipedia language editions as a
380       function of their language’s eigenvector centrality.
381     \item The bottom row shows the number of people per language (born
382       1800–1950) listed in \emph{Human Accomplishment} (a book by
383       Charles Murray) as a function of their language’s eigenvector
384       centrality.
385     \end{itemize}}
386 \end{frame}
387
388
389 \subsection{Community and Organization}
390
391 \begin{frame}
392   \centertext{6em}{Community and Organization}
393
394   \note{Mako}
395 \end{frame}
396
397 \begin{frame}
398
399   \frametitle{Community and organization}
400
401   \larger \larger Warncke-Wang, M., Ranjan, V., Terveen, L., \& Hecht,
402   B. (2015). \e{Misalignment Between Supply and Demand of Quality Content
403   in Peer Production Communities}. In Ninth International AAAI
404   Conference on Web and Social Media (ICWSM).
405
406   % Retrieved from \href{http://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10591}{http://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10591}
407
408 \end{frame}
409
410 \begin{frame}
411   \frametitle{Community and organization: Warncke-Wang et al.}
412   
413   \larger \larger
414   \e{Perfect Alignment Hypothesis (PAH)}: There is an exact match
415   between the supply of high-quality content and the demand for it.
416
417   \bigskip
418
419   \includegraphics[width=\textwidth]{figures/warncke-english_confusion.pdf}
420
421   \note{\e{Quality}: Stub, Start, C, B, Good Article, A, Featured Article
422   
423     \e{Popularity}: equivalently sized buckets}
424 \end{frame}
425
426 \begin{frame}
427   \frametitle{Community and organization: Warncke-Wang et al.}
428
429   Measure of the degree of misalignment can be used to build lists of
430   categories that are relatively \e{``overproduced''} and
431   \e{``underproduced''}:
432
433   \bigskip
434
435   \includegraphics[width=\textwidth]{figures/warncke-english_overunder.pdf}
436 \end{frame}
437
438 \subsection{Content Quality}
439
440 \begin{frame}
441    \centertext{6em}{Content quality}
442
443    \note{Tilman
444
445      A decade after the landmark "Nature" study, there still aren't too
446      many systematic evaluations of the accuracy of Wikipedia's content. 
447      Health articles continue to receive scrutiny, though. With good 
448      reason: Wikipedia is "the most frequently consulted online health 
449      care resource globally" [NEJM article].}
450 \end{frame}
451
452 \begin{frame}
453   
454 \frametitle{Quality of drug articles}
455
456    \larger \larger
457    Hwang et al., ``\e{Drug Safety in the Digital Age}.'' 
458    N Engl J Med 2014; 370:2460-2462 June 26, 2014 
459    \href{http://dx.doi.org/10.1056/NEJMp1401767}{doi: 10.1056/NEJMp1401767}.
460    \bigskip
461    
462    Kräenbring et al., \e{Accuracy and completeness of drug 
463    information in Wikipedia: a comparison with standard textbooks of 
464    pharmacology}. PLoS One 9 (9): e106930. 
465    \href{http://dx.doi.org/10.1371/journal.pone.0106930}
466    {doi:10.1371/journal.pone.0106930}
467    
468
469    \note{Tilman
470    
471      We selected two papers that evaluated drug articles, with 
472      different approaches. The first one is a short article in the 
473      extremely prestigious NEJM.}
474 \end{frame}
475
476 \begin{frame}
477   
478 \frametitle{Quality of drug articles: NEJM}
479
480    \includegraphics[width=0.49\textwidth]{figures/Pradaxa_tweet_FDAMedWach.png}
481    % from https://twitter.com/FDAMedWatch/status/281547908095041536
482    % = first one in the list at http://www.nejm.org/doi/suppl/10.1056/NEJMp1401767/suppl_file/nejmp1401767_appendix.pdf
483    \includegraphics[width=0.49\textwidth]{figures/Dabitragan_Contraindications_WP_FDA_warning}
484   
485    \tikz{\node [yshift=1.5cm,xshift=-0.4cm] at (current page.center) {\includegraphics[width=1.5cm]{figures/long-arrow-right.png}};}
486    \begin{itemize}
487      \larger \larger
488      \item The US Food and Drug Administration (\e{FDA}) frequently 
489      issues safety warnings about prescription drugs. How long does it 
490      take until these are reflected on English Wikipedia?
491      \item 41\% updated within two weeks (58\% for high-prevalent 
492      diseases), but 36\% still unchanged after more than a year.
493    \end{itemize}
494    
495    \note{Tilman
496    
497    Articles about drugs used to treat high-prevalent diseases (affecting 
498    > 1 m Americans / year) were updated faster.\\ 
499    But the result still caused concern.\\
500    Authors find "there may be a benefit to enabling the FDA to update or 
501    automatically feed new safety communications to Wikipedia pages, as 
502    it does with WebMD". The paper raised awareness among WikiProject 
503    Medicine editors, but there's no systematic updating mechanism yet.}
504
505
506 \end{frame}
507
508 \begin{frame}
509
510 \frametitle{Quality of drug articles: PLoS One}
511
512   \begin{itemize}
513    \larger \larger \larger
514    \item Selected 100 drugs from German undergrad curriculum in pharmacology
515    \item Extracted information from two standard textbooks
516    \item "Accuracy of drug information in [German] Wikipedia was 99.7\%±0.2\% when compared to the textbook data." Similar results for English Wikipedia
517    \end{itemize}
518
519 \end{frame}
520
521
522 \begin{frame}
523
524 \frametitle{Quality of drug articles: PLoS One}
525
526   \begin{itemize}
527    \larger \larger \larger
528    \item Completeness (as compared to the textbooks):
529    \begin{itemize} \larger \larger
530      \item 83.8\% (of 224 statements) for German WP
531      \item 87.2\% for English WP
532    \end{itemize}   
533    \item Completeness of contraindications information was 100\% in the En WP sample.
534    \item English WP cited academic publications more often than German WP.
535    \item Quality "significantly improved" in drug articles assessed 
536         in a 2010 study.
537    \end{itemize}
538
539     \note{Tilman
540     
541        The majority of the missing information (62.5\%) on German WP 
542        was judged non-relevant for undergrad students.
543     
544        The result on completeness of contraindications information is 
545        somewhat in contrast with the NEJM study. Then again, the 
546        textbooks were probably not perfectly up-to-date either.}
547 \end{frame}
548
549
550
551 \begin{frame}
552    \centertext{6em}{Automation in Wikipedia}
553
554    \note{Tilman
555    
556      Starting to see more practical applications of AI methods to editing.
557
558      Bots have been writing Wikipedia articles ever since back in 2002, 
559      User:Rambot covered US municipalities from US census data.
560      
561      Picked these two related papers for their somewhat unusual approach}
562 \end{frame}
563
564
565 \begin{frame}
566   \frametitle{Automation in Wikipedia}
567
568   \larger \larger
569   Banerjee et al., \e{Playscript Classification and Automatic Wikipedia 
570   Play Articles Generation}. 
571   2014 22nd International Conference on Pattern Recognition (ICPR). 
572   pp. 3630–3635. 
573   \href{http://dx.doi.org/10.1109/ICPR.2014.624}
574   {DOI:10.1109/ICPR.2014.624}
575   \href{http://www.cse.unt.edu/~ccaragea/papers/icpr14.pdf}{Author's copy}
576
577 \end{frame}
578
579
580 \begin{frame}
581
582 \frametitle{Automation in Wikipedia: Bot-written theatre play articles}
583
584   \begin{itemize}
585    \larger \larger \larger
586    \item Bot searches for playscripts and related documents on the web
587      \bigskip
588    \item Extract key information from them, e.g.
589      \begin{itemize} \larger
590       \item The play's main characters
591       \item Relevant sentences from online synopses of the play
592       \item Mentions in Google Books and Google News (as evidence that 
593       the play satisfies Wikipedia's notability criteria)
594       
595       \end{itemize}
596       
597       \item Some heuristics to exclude non-encyclopedic sentences, e.g. 
598        first person statements
599       
600    \end{itemize}
601
602     \note{Tilman
603     
604            NB: Most article creation bots work from well-defined databases
605            (e.g. species, census data, geographical databases). 
606     
607        This bots finds article topics and online references itself, 
608        using an elaborate classifier algorithm to distinguish scripts 
609        from non-scripts.}
610 \end{frame}
611
612 \begin{frame}
613 \frametitle{Automation in Wikipedia: Bot-written theatre play articles}
614
615   \begin{columns}
616   \column{0.4\textwidth}
617   \includegraphics[width=\textwidth]{figures/Fourteen_submission.png}
618   \column{0.5\textwidth}
619   \begin{itemize}
620    \larger \larger \larger
621    \item 15 articles submitted at Articles for Creation. Two accepted 
622    by Wikipedia editors. One of them without major changes.  
623       
624    \end{itemize}
625
626 \end{columns}
627
628     \note{Tilman
629     
630     Editors were unaware the articles had been automatically generated.
631     
632     
633     Related paper by some of the same authors:
634   
635     Banerjee et al., \e{WikiKreator: Improving Wikipedia Stubs 
636     Automatically}. \href{https://siddbanpsu.github.io/publications/acl2015-banerjee-preprint.pdf}
637     {preprint}, accepted paper at ACL2015
638     
639     Elaborate classifier method to find suitable web resources for 
640     expanding stubs - but copying sentences wholesale from these into
641     articles landed the bot (User:MightyPepper) in a \href{https://en.wikipedia.org/wiki/Wikipedia:Contributor_copyright_investigations/Archive#2015}{contributor copyright investigation}\ldots
642     }
643 \end{frame}
644
645
646
647
648 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
649 \subsection{Gender on Wikipedia}
650 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
651
652 \begin{frame}
653    \centertext{6em}{Gender Beyond the Gap}
654   
655
656    \note{Aaron:
657
658      Research focused on understanding gender dynamics in Wikipedia
659      and their impact is another area of research that has continued
660      to expand this year. A number of high quality papers came out,
661      several of which analyzed how gender figures in the content of
662      the encyclopedias.
663      }
664  \end{frame}
665
666  \begin{frame}
667    \frametitle{It's a Man's Wikipedia?}
668    \larger \larger Wagner, Claudia; David Garcia; Mohsen Jadidi; and Markus
669 Strohmaier. 2015. \href{https://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10585}{``\e{It's a Man's Wikipedia? Assessing
670   Gender Inequality in an Online Encyclopedia}.''} Ninth International
671 AAAI Conference on Web and Social Media (ICWSM).
672
673  \end{frame}
674
675  \begin{frame}
676
677    \frametitle{It's a Man's Wikipedia: Motivation}
678
679    \begin{itemize}
680      \larger \larger \larger
681    \item We know there's a gender gap.
682    \item Need for more multidimensional analysis of \e{how gender is
683      represented in content of articles across Wikipedias}.
684    \end{itemize}
685
686    \note{
687 }
688  \end{frame}
689
690  \begin{frame}
691
692    \frametitle{It's a Man's Wikipedia: Methods}
693
694    \begin{itemize}
695    \larger \larger \larger
696    \item Use data from three sources (Freebase, ``Human
697      Accomplishment,'' and Pantheon) as baselines for comparison with
698      six Wikipedias (EN, ES, DE, FR, IT, RU).
699    \item Examine multiple potential forms of bias: coverage,
700      structure, lexical characteristics, visibility. 
701    \end{itemize}
702
703  \end{frame}
704
705  \begin{frame}
706    \frametitle{It's a Man's Wikipedia: Results}
707
708    \centering
709    \visible<2->{
710    \includegraphics[width=\textwidth]{figures/mans_wikipedia_fig.pdf}
711    }
712  \note{
713    \e{Some key findings:}
714    \begin{itemize}
715    \larger \larger
716  \item 1: Coverage of women (\# articles, length) in WPs is generally
717    better than other sources.
718  \item 2: Articles about women tend to be less centrally connected in
719    the network of articles than articles about men (Smurfette!)
720  \item 3: (\e{viz}) Content of articles about women uses different words
721    than those about men. Much higher incidence of language related to
722    family, gender, and relationships.
723    \end{itemize}
724 }
725  \end{frame}
726
727 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
728 \subsection{Using Wikipedia in Education} % TODO Fix title
729 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
730
731 \begin{frame}
732    \centertext{6em}{Adopting Wikipedia as a Teaching Tool}
733   
734    \note{Aaron:
735
736      Research focused on understanding how Wikipedia and related
737      resources are adopted for classroom teaching. Growing area of
738      work, still somewhat preliminary findings. Nonetheless, some of
739      the papers in this domain make for entertaining reading...
740      }
741  \end{frame}
742
743  \begin{frame}
744    \frametitle{WP and the Wisdom of Crowds}
745
746    \larger \larger Barnhisel, Greg and Marcia
747    Rapchak. 2014. \href{http://ur1.ca/n5919}{``\e{Wikipedia and the Wisdom of Crowds: A Student
748      Project}.''} Communications in Information Literacy 8(1):
749    145-159. doi:10.7548/cil.v8i1.249.
750 \end{frame}
751
752
753 \begin{frame}
754    \frametitle{WP and the Wisdom of Crowds: Motivation}
755    \begin{itemize}
756      \larger \larger
757    \item Students use Wikipedia uncritically. Don't understand how low
758      quality much of the information may be or how it may be
759      manipulated.
760    \item Professor (author) believes that WP is full of dubious
761      information. Wants to unmask that for his students.
762    \item Through more in-depth exposure, students may understand the
763      limitations of collaborative, open systems of knowledge production.
764    \end{itemize}
765 \end{frame}
766
767
768 \begin{frame}
769    \frametitle{WP and the Wisdom of Crowds: Methods}
770
771    \begin{itemize}
772      \larger \larger
773    \item Require a Senior (college) composition class to work on
774      editing WP articles (together and individually) throughout the
775      semester. 
776    \item Incorporate assignments to help students learn about the
777      history of WP as well as how to use it.
778    \item Require students to reflect on their experiences in writing.
779    \item Require students to analyze the pros/cons of open
780      collaborative writing in their final projects.
781    \end{itemize}
782
783 \note{ 
784   This is all sort of fabulously in-line with exactly what the WikiEd
785   Foundation recommends instructors do (!).
786 }
787 \end{frame}
788
789
790 \begin{frame}
791    \frametitle{WP and the Wisdom of Crowds: Results}
792
793 \centering
794 \begin{quote}
795   \e{Both sources [crowds and experts] have different merits... My
796     life experience since class pulls me in favor of the wisdom of the
797     crowd. In my recent studies, I have found that I can learn much
798     more from a group of my peers than from a single expert.\\ \hfill
799     --- Student 1}
800 \end{quote}
801
802 \note{ Not exactly what the instructor expected. Essentially, both he
803   and the students came away with much more nuanced, and positive,
804   views of the relative merits, possibilities, and limitations of open
805   collaborative knowledge production. A happy ending :) }
806 \end{frame}
807 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
808
809
810
811 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
812 \section{Conclusion}
813 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
814
815 \subsection{Meta-Analyses}
816
817 \begin{frame}
818
819   \frametitle{Meta-Analyses}
820
821   \begin{itemize}
822
823     \larger \larger
824   \item Mesgari, Mostafa and Okoli, Chitu and Mehdi, Mohamad and Nielsen, Finn Årup and Lanamäki, Arto. 2014. \href{http://spectrum.library.concordia.ca/978652/}{``The sum of all human knowledge": A systematic review of scholarly research on the content of Wikipedia''}. Journal of the Association for Information Science and Technology. 
825
826   \item Miquel-Ribé,
827     Marc. 2015. \href{https://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10645}{``User
828       Engagement on Wikipedia, A Review of Studies of Readers and
829       Editors.''} Ninth International AAAI Conference on Web and
830     Social Media (ICWSM).
831
832   \end{itemize}
833
834 \end{frame}
835
836 %% SLIDE: Other Resources
837 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
838 \begin{frame}{More Resources}
839
840   \begin{itemize}
841     \larger \larger
842   \item \e{Wikimedia Research Newsletter} [[:meta:Research:Newsletter]] / @WikiResearch
843   \item \e{WikiSym/OpenSym} (This August in San Francisco!)
844   \item \e{WikiPapers Repository} [http://wikipapers.referata.com]
845   \item \e{Much More}
846   \end{itemize}
847
848   {\centering 
849     \includegraphics[width=0.25\textwidth]{figures/Wikimedia_Research_Newsletter_Logo.png}
850
851   }
852
853   \note{Those are my six exemplary studies from the past year. 
854
855     There has been just tons and tons of work in this area. Trying to
856     talk about this in 20 minutes strikes me as increasingly crazy
857     every year I try to do it.
858
859     The most important source, now going for a couple years, is the
860     Wikimedia Research Newsletter which is published monthly in the (English)
861     Signpost and syndicated on the Wikimedia Research.
862
863     But there are other resources as well. And I encourage you to get
864     involved.}
865
866 \end{frame}
867
868
869 \end{document}
870
871
872 %  LocalWords:  xshift yshift makopurple Tilman wikipedia Scopus Hu
873 %  LocalWords:  Ronen Gonçalves Vespignani Hidalgo al Galician Ranjan
874 %  LocalWords:  eigenvector Warncke Terveen Hecht underproduced NEJM
875 %  LocalWords:  Hwang Engl doi Kräenbring WebMD WikiProject Mohsen
876 %  LocalWords:  Jadidi Markus Strohmaier Wikipedias WPs Smurfette
877 %  LocalWords:  Barnhisel Rapchak WikiEd Mesgari Mostafa Okoli Chitu
878 %  LocalWords:  Mehdi Mohamad Årup Lanamäki Arto Miquel Ribé OpenSym
879 %  LocalWords:  WikiPapers

Benjamin Mako Hill || Want to submit a patch?