move one Automation piece to notes, as the deck is already on the long side
[state_of_wikimedia_research_2015] / 20150717-wikimania_research.tex
1 \documentclass[xcolor=dvipsnames]{beamer}
2
3 % set up the file to create notes in the output PDFs
4 \usepackage{pgfpages}
5 \input{notes.config}
6
7 \renewcommand{\rmdefault}{ugm}
8 \usepackage[garamond]{mathdesign}
9
10 \renewcommand{\sfdefault}{phv}
11 \usepackage{relsize}
12
13 \usepackage{ucs}
14 \usepackage[utf8x]{inputenc}
15 \usepackage[T1]{fontenc}
16 \usepackage{textcomp}
17
18 % add tikz and a bunch of tikz foo
19 \usepackage{tikz}
20 \usetikzlibrary{shapes,shapes.misc,backgrounds,fit,positioning}
21 \tikzstyle{every picture}+=[overlay,remember picture]
22
23 % add functions to circle parts of slides (e.g., in tables)
24 \newcommand\marktopleft[1]{\tikz \node (marker-#1-a) at (0,1.5ex) {};}
25 \newcommand\markbottomright[1]{%
26   \tikz{\node (marker-#1-b) at (0,0) {};}
27   \tikz[dashed,inner sep=3pt]{\node[violet!75,ultra thick,draw,rounded rectangle,fit=(marker-#1-a.center) (marker-#1-b.center)] {};}}
28
29 % DEPRECATED function to build a huge centered dropshadow
30 \newcommand\dropshadow[3]{%
31   \node[black!30!white] at (#1+0.1,#2-0.1) {
32     \scalebox{2}{\Huge \textbf{#3}}
33   };
34   \node at (#1,#2) {
35     \scalebox{2}{\Huge \e{#3}}
36   };
37 }
38
39 % create an empty quotetxt so we can reuse it
40 \newcommand{\quotetxt}{}
41
42 % more flexible non-tikz alternative with no dropshadow 
43 \newlength{\centertxtlen}
44 \makeatletter
45 \newcommand\centertext[2]{%
46   \setlength{\centertxtlen}{#1}%
47   \setlength{\centertxtlen}{0.48\centertxtlen}%
48   {\centering
49     \fontsize{#1}{2\centertxtlen}\selectfont
50     \e{#2}
51
52   }
53 }
54
55
56 % add function to stop numbering appendix slides
57 \newcommand{\backupbegin}{
58    \newcounter{framenumberappendix}
59    \setcounter{framenumberappendix}{\value{framenumber}}
60 }
61 \newcommand{\backupend}{
62    \addtocounter{framenumberappendix}{-\value{framenumber}}
63    \addtocounter{framenumber}{\value{framenumberappendix}} 
64 }
65
66 % packages i use in essentially every document
67 \usepackage{graphicx}
68 \usepackage{url}
69 % \usepackage{dcolumn}
70 % \usepackage{booktabs}
71
72 % replace footnotes with symbols instead of numbers
73 \renewcommand*{\thefootnote}{\fnsymbol{footnote}}
74 \usepackage{perpage}
75 \MakePerPage{footnote}
76
77 %% BEAMER THEME STUFF
78 \usetheme[pageofpages=/,% String used between the current page and the
79                          % total page count.
80           bullet=default,% Use circles instead of squares for bullets.
81           titleline=false,% Show a line below the frame title.
82           alternativetitlepage=true,% Use the fancy title page.
83           titlepagelogo=figures/logo.pdf,% Logo for the first page.
84           %watermark=watermark-polito,% Watermark used in every page.
85           watermarkheight=100px,% Height of the watermark.
86           watermarkheightmult=4,% The watermark image is 4 times bigger
87                                 % than watermarkheight.
88           ]{Torino}
89
90 \usecolortheme{mako}
91 \useinnertheme{rectangles}
92 %\setbeamertemplate{blocks}[rounded][]
93 \setbeamercolor{block title}{bg=makopurple3, fg=White}
94
95 \setbeamertemplate{items}[default] 
96 \setbeamertemplate{blocks}[shadow=true] 
97
98 \usepackage{tcolorbox}
99 % These options will be applied to all `tcolorboxes`
100 \tcbset{%
101     noparskip,
102     colback=makopurple5, %background color of the box
103     colframe=makopurple1, %color of frame and title background
104     coltext=black, %color of body text
105     coltitle=white, %color of title text 
106     arc=0em,
107     left=0.1em,
108     right=0.1em,
109     fonttitle=\bfseries,
110     alerted/.style={coltitle=red, 
111                      colframe=gray!40},
112     example/.style={coltitle=black, 
113                      colframe=green!20,             
114                      colback=green!5},
115     }
116
117
118 %\useoutertheme{infolines}
119 %\usepackage[breaklinks]{hyperref}
120
121 \hypersetup{colorlinks=true, linkcolor=Black, citecolor=Black, filecolor=makopurple1,
122     urlcolor=Plum, unicode=true}
123
124 % create a boldface version of the header
125 \setbeamerfont{frametitle}{series=\bfseries}
126 \setbeamerfont{title}{series=\bfseries}
127
128 % tweak the beamer font to make it a bit lists a bit smaller
129 \setbeamerfont*{itemize/enumerate body}{size=\small}
130 \setbeamerfont*{itemize/enumerate subbody}{size=\footnotesize}
131 \setbeamerfont*{itemize/enumerate subsubbody}{size=\footnotesize}
132
133 % indent the margins of the itemize lists a little bit
134 \setlength{\leftmargin}{0pt}
135 \setlength{\leftmargini}{0.7cm}
136 \setlength{\leftmarginii}{0.7cm}
137
138 % create a new \e{} command to make things purple and bold
139 \newcommand{\e}[1]{\textcolor{makopurple1}{\textbf{#1}}}
140
141 % remove the nagivation symbols
142 \setbeamertemplate{navigation symbols}{}
143
144 \title{Presentation Title}
145 % \subtitle{Presentation Subtitle}
146 \author[Benj. Mako Hill]{\textbf{Benjamin Mako Hill}\\ makohill@uw.edu}
147
148 \institute[UW/Harvard]{\textbf{University of Washington}\\
149   Department of Communication\\
150   \emph{Assistant Professor}\\
151   \hspace{1pt}\\
152   \textbf{Harvard University}\\
153   Berkman Center for Internet and Society\\
154   \emph{Resident Fellow}}
155
156 \date{December 2, 1980}
157
158 \newcommand{\credit}[1]{%
159   \tikz[overlay]{\node at (current page.south east)
160     [anchor=south east,yshift=1.1em,xshift=0.35em]
161     {\smaller \smaller {[}#1{]}};}}
162
163 \begin{document}
164
165 % remove some of the space in the itemize to make it quite compact
166 \let\olditemize\itemize
167 \renewcommand\itemize{\olditemize\itemsep-1pt}
168
169 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
170 \section{Introduction}
171 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
172
173 %% SLIDE: Title Slide
174 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
175 \begin{frame}[plain]
176
177   \begin{tikzpicture}
178     \node at (current page.center) [xshift=-3.5cm, yshift=0.5cm, opacity=0.4]
179       {\includegraphics[height=\paperheight]{figures/wikimedia_projects.png}};
180
181
182     \node at (current page.south east)
183     [anchor=south east,text width=1.8\paperwidth,align=right,color=black]
184     {
185       {\spaceskip 0.3em%
186         \fontsize{2.5em}{2.5em}
187         \selectfont {\bf \color{makopurple4} The State of Wikimedia\\
188           Research: 2014-2015} \par}
189
190       \vspace{1em}
191
192       {\spaceskip 0.3em%
193         \fontsize{2.0em}{2.1em}
194         \selectfont {\bf \color{black} Benjamin Mako Hill\\
195           Tilman Bayer\\
196           Aaron Shaw\\
197           Wikimania 2015, Mexico City\\
198           July 17, 2015} \par}
199
200     };
201   \end{tikzpicture}
202
203 % Removed to accommodate Tilman's setup  
204 %  \input{vc}
205 %
206 %  \tikz[overlay,shift=(current page.south west)]{\node [xshift=5.6em,yshift=0.5em]{\colorbox{makopurple1}{\color{white} \tt \smaller \smaller \smaller revision:\ \VCRevision\  (\VCDateTEX)}};}
207
208   \note{I've been doing this for many years. I started in 2008 and
209     have done this almost every single year since.
210
211     This began as an excuse for me to make sure I was up to date on
212     Wikimedia Research.}
213
214 \end{frame}
215
216 %% SLIDE: Anecdote from Wikimania 2008
217 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
218 \renewcommand{\quotetxt}{``This talk will try to [provide] a quick
219   tour – a literature review in the scholarly parlance – of the last
220   year's academic landscape around Wikimedia and its projects geared
221   at non-academic editors and readers. It will try to categorize,
222   distill, and describe, from a birds eye view, the academic landscape
223   as it is shaping up around
224   our project.''\\
225   \hfill – \e{From my Wikimania 2008 Submission}}
226
227 \begin{frame}
228
229   {\smaller \quotetxt}
230
231   \pause
232   \includegraphics[width=\textwidth]{figures/google_scholar_result.png}
233
234   \pause
235   \tikz{\draw (current page.center) [xshift=-2.1cm, yshift=0.9cm, color=red]
236     ellipse (1.5cm and 0.5cm);}
237
238   \note<1>{Back in Wikimania 2008, I set out to run a session at
239     Wikimania that would provide a comprehensive literature review of
240     articles in Wikipedia published in the last year.
241
242     \begin{quote}
243       \quotetxt
244     \end{quote}
245
246     Then, about two weeks before Wikimania, I did the scholar search
247     so I could build the literature.}
248
249   \note<2->{I tried to import the whole list into Zotero and managed
250     to get banned for abusing the Google Scholar because they thought
251     that no human being could realistically consume the amount of
252     material published on Wikipedia that year.
253
254     So anyway, I had a 45 minute talk so it worked out to 3.45 seconds
255     to per paper...
256
257     And believe it or not, this year is even bigger.
258  
259     And my talk is even shorter.}
260
261 \end{frame}
262
263 %% SLIDE: Citations Per Year
264 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
265 \begin{frame}
266
267   \includegraphics[width=\textwidth]{figures/citations_by_year.pdf}
268
269   \centering
270
271   {\smaller \emph{Number of citation, per year, with the term
272       “wikipedia” in the title.\\
273       (Source: Google scholar results. Accessed: 2013-08-06)}}
274
275   \note{Academics have written \e{a lot} of papers about
276     Wikipedia. There are more than 500 papers published about
277     Wikipedia each year and although we've reached and moved past a
278     peak it seems, it's not slowing by much.}
279
280 \end{frame}
281
282 \begin{frame}
283
284   \begin{itemize}
285     \larger \larger
286   \item \e{2968} Wikipedia-related publications in the Scopus database
287     as of November 2013
288
289   \item \e{191} recent publications reviewed or mentioned in the 12 issues
290     of the Wikimedia Research Newsletter from July 2014 to June 2015.
291   \end{itemize}
292
293 \end{frame}
294
295 %% SLIDE: My Scope Conditions
296 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
297 \begin{frame}
298
299   \includegraphics[width=\textwidth]{figures/multiple_issues.png}
300
301   \larger \larger
302   In selecting papers for this session, the goal is always to choose
303   examples of work that:
304
305   \begin{itemize}
306   \larger \larger
307   \item Represent \e{important themes} from Wikipedia in the last year.
308   \item Research that is likely to be of \e{interest} to Wikimedians.
309   \item Research by people who are \e{not at Wikimania}.
310   \item \ldots with a bias towards \e{peer-reviewed} publications 
311   \end{itemize}
312
313   \note{This is my disclaimer slide...
314
315   Within these goals, the selections are \e{incomplete}, and \e{wrong}.}
316 \end{frame}
317
318 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
319 \section{Paper Summaries}
320 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
321
322 \begin{frame}
323   \centertext{6em}{Wikipedia as a Source of Data}
324
325   \note{Mako}
326 \end{frame}
327
328 \begin{frame}
329
330   \frametitle{Wikipedia as a source of data}
331
332   \larger \larger Ronen, S., Gonçalves, B., Hu, K. Z., Vespignani, A.,
333   Pinker, S., \& Hidalgo, C. A. (2014). \e{Links that speak: The
334     global language network and its association with global
335     fame}. Proceedings of the National Academy of Sciences, 111(52),
336   E5616—E5622. \href{http://doi.org/10.1073/pnas.1410931111}{doi:10.1073/pnas.1410931111}
337
338 \end{frame}
339
340 \begin{frame}
341   \frametitle{How to measure the global influence of languages?}
342
343   \larger \larger
344
345   \e{Traditional} methods rely on:
346
347   \begin{itemize}
348     \larger \larger
349   \item \e{Population} of speakers
350   \item \e{Income} or political power of speakers
351   \end{itemize}
352
353   Paper presents \e{new network method} based on measuring
354   \e{co-speakers} of languages in several data sources including
355   Wikipedia.
356
357 \end{frame}
358
359 \begin{frame}
360   \frametitle{Wikipedia as a source of data: Ronen et al.}
361
362   \includegraphics[width=\textwidth]{figures/ronen_fig1.png}
363
364   \note{Two languages are connected when users that edit an article in
365     one Wikipedia language edition are significantly more likely to
366     also edit an article in the edition of the other language.
367
368     If an editor of Spanish is also likely to edit Galician, we'll
369     call those languages connected.}
370 \end{frame}
371
372 \begin{frame}
373   \frametitle{Wikipedia as a source of data: Ronen et al.}
374
375   \includegraphics[width=\textwidth]{figures/ronen_people.png}
376
377   \note{\begin{itemize}
378     \item The number of people per language (born 1800–1950) with
379       articles in at least 26 Wikipedia language editions as a
380       function of their language’s eigenvector centrality.
381     \item The bottom row shows the number of people per language (born
382       1800–1950) listed in \emph{Human Accomplishment} (a book by
383       Charles Murray) as a function of their language’s eigenvector
384       centrality.
385     \end{itemize}}
386 \end{frame}
387
388
389 \subsection{Community and Organization}
390
391 \begin{frame}
392   \centertext{6em}{Community and Organization}
393
394   \note{Mako}
395 \end{frame}
396
397 \begin{frame}
398
399   \frametitle{Community and organization}
400
401   \larger \larger Warncke-Wang, M., Ranjan, V., Terveen, L., \& Hecht,
402   B. (2015). \e{Misalignment Between Supply and Demand of Quality Content
403   in Peer Production Communities}. In Ninth International AAAI
404   Conference on Web and Social Media (ICWSM).
405
406   % Retrieved from \href{http://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10591}{http://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10591}
407
408 \end{frame}
409
410 \begin{frame}
411   \frametitle{Community and organization: Warncke-Wang et al.}
412   
413   \larger \larger
414   \e{Perfect Alignment Hypothesis (PAH)}: There is an exact match
415   between the supply of high-quality content and the demand for it.
416
417   \bigskip
418
419   \includegraphics[width=\textwidth]{figures/warncke-english_confusion.pdf}
420
421   \note{\e{Quality}: Stub, Start, C, B, Good Article, A, Featured Article
422   
423     \e{Popularity}: equivalently sized buckets}
424 \end{frame}
425
426 \begin{frame}
427   \frametitle{Community and organization: Warncke-Wang et al.}
428
429   Measure of the degree of misalignment can be used to build lists of
430   categories that are relatively \e{``overproduced''} and
431   \e{``underproduced''}:
432
433   \bigskip
434
435   \includegraphics[width=\textwidth]{figures/warncke-english_overunder.pdf}
436 \end{frame}
437
438 \subsection{Content Quality}
439
440 \begin{frame}
441    \centertext{6em}{Content quality}
442
443    \note{Tilman
444
445      A decade after the landmark "Nature" study, there still aren't too
446      many systematic evaluations of the accuracy of Wikipedia's content. 
447      Health articles continue to receive scrutiny, though. With good 
448      reason: Wikipedia is "the most frequently consulted online health 
449      care resource globally" [NEJM article].}
450 \end{frame}
451
452 \begin{frame}
453   
454 \frametitle{Quality of drug articles}
455
456    \larger \larger
457    Hwang et al., ``\e{Drug Safety in the Digital Age}.'' 
458    N Engl J Med 2014; 370:2460-2462 June 26, 2014 
459    \href{http://dx.doi.org/10.1056/NEJMp1401767}{doi: 10.1056/NEJMp1401767}.
460    \bigskip
461    
462    Kräenbring et al., \e{Accuracy and completeness of drug 
463    information in Wikipedia: a comparison with standard textbooks of 
464    pharmacology}. PLoS One 9 (9): e106930. 
465    \href{http://dx.doi.org/10.1371/journal.pone.0106930}
466    {doi:10.1371/journal.pone.0106930}
467    
468
469    \note{Tilman
470    
471      We selected two papers that evaluated drug articles, with 
472      different approaches. The first one is a short article in the 
473      extremely prestigious NEJM.}
474 \end{frame}
475
476 \begin{frame}
477   
478 \frametitle{Quality of drug articles: NEJM}
479
480    \includegraphics[width=0.49\textwidth]{figures/Pradaxa_tweet_FDAMedWach.png}
481    % from https://twitter.com/FDAMedWatch/status/281547908095041536
482    % = first one in the list at http://www.nejm.org/doi/suppl/10.1056/NEJMp1401767/suppl_file/nejmp1401767_appendix.pdf
483    \includegraphics[width=0.49\textwidth]{figures/Dabitragan_Contraindications_WP_FDA_warning}
484   
485    \tikz{\node [yshift=1.5cm,xshift=-0.4cm] at (current page.center) {\includegraphics[width=1.5cm]{figures/long-arrow-right.png}};}
486    \begin{itemize}
487      \larger \larger
488      \item The US Food and Drug Administration (\e{FDA}) frequently 
489      issues safety warnings about prescription drugs. How long does it 
490      take until these are reflected on English Wikipedia?
491      \item 41\% updated within two weeks (58\% for high-prevalent 
492      diseases), but 36\% still unchanged after more than a year.
493    \end{itemize}
494    
495    \note{Tilman
496    
497    Articles about drugs used to treat high-prevalent diseases (affecting 
498    > 1 m Americans / year) were updated faster.\\ 
499    But the result still caused concern.\\
500    Authors find "there may be a benefit to enabling the FDA to update or 
501    automatically feed new safety communications to Wikipedia pages, as 
502    it does with WebMD". The paper raised awareness among WikiProject 
503    Medicine editors, but there's no systematic updating mechanism yet.}
504
505
506 \end{frame}
507
508 \begin{frame}
509
510 \frametitle{Quality of drug articles: PLoS One}
511
512   \begin{itemize}
513    \larger \larger \larger
514    \item Selected 100 drugs from German undergrad curriculum in pharmacology
515    \item Extracted information from two standard textbooks
516    \item "Accuracy of drug information in [German] Wikipedia was 99.7\%±0.2\% when compared to the textbook data." Similar results for English Wikipedia
517    \end{itemize}
518
519 \end{frame}
520
521
522 \begin{frame}
523
524 \frametitle{Quality of drug articles: PLoS One}
525
526   \begin{itemize}
527    \larger \larger \larger
528    \item Completeness (as compared to the textbooks):
529    \begin{itemize} \larger \larger
530      \item 83.8\% (of 224 statements) for German WP
531      \item 87.2\% for English WP
532    \end{itemize}   
533    \item Completeness of contraindications information was 100\% in the En WP sample.
534    \item English WP cited academic publications more often than German WP.
535    \item Quality "significantly improved" in drug articles assessed 
536         in a 2010 study.
537    \end{itemize}
538
539     \note{Tilman
540     
541        The majority of the missing information (62.5\%) on German WP 
542        was judged non-relevant for undergrad students.
543     
544        The result on completeness of contraindications information is 
545        somewhat in contrast with the NEJM study. Then again, the 
546        textbooks were probably not perfectly up-to-date either.}
547 \end{frame}
548
549
550
551 \begin{frame}
552    \centertext{6em}{Automation in Wikipedia}
553
554    \note{Tilman
555    
556      Starting to see more practical applications of AI methods to editing.
557
558      Bots have been writing Wikipedia articles ever since back in 2002, 
559      User:Rambot covered US municipalities from US census data.
560      
561      Picked these two related papers for their somewhat unusual approach}
562 \end{frame}
563
564
565 \begin{frame}
566   \frametitle{Automation in Wikipedia}
567
568   \larger \larger
569   Banerjee et al., \e{Playscript Classification and Automatic Wikipedia 
570   Play Articles Generation}. 
571   2014 22nd International Conference on Pattern Recognition (ICPR). 
572   pp. 3630–3635. 
573   \href{http://dx.doi.org/10.1109/ICPR.2014.624}
574   {DOI:10.1109/ICPR.2014.624}
575   \href{http://www.cse.unt.edu/~ccaragea/papers/icpr14.pdf}{Author's copy}
576
577 \end{frame}
578
579
580 \begin{frame}
581
582 \frametitle{Automation in Wikipedia: Bot-written theatre play articles}
583
584   \begin{itemize}
585    \larger \larger \larger
586    \item Bot searches for playscripts and related documents on the web
587      \bigskip
588    \item Extract key information from them, e.g.
589      \begin{itemize} \larger
590       \item The play's main characters
591       \item Relevant sentences from online synopses of the play
592       \item Mentions in Google Books and Google News (as evidence that 
593       the play satisfies Wikipedia's notability criteria)
594       
595       \end{itemize}
596       
597       \item Some heuristics to exclude non-encyclopedic sentences, e.g. 
598        first person statements
599       
600    \end{itemize}
601
602     \note{Tilman
603     
604            NB: Most article creation bots work from well-defined databases
605            (e.g. species, census data, geographical databases). 
606     
607        This bots finds article topics and online references itself, 
608        using an elaborate classifier algorithm to distinguish scripts 
609        from non-scripts.}
610 \end{frame}
611
612 \begin{frame}
613 \frametitle{Automation in Wikipedia: Bot-written theatre play articles}
614
615   \includegraphics[width=0.3\textwidth]{figures/Fourteen_submission.png}
616   \begin{itemize}
617    \larger \larger \larger
618    \item 15 articles submitted at Articles for Creation. Two accepted 
619    by Wikipedia editors. One of them without major changes.
620    
621       
622    \end{itemize}
623
624     \note{Tilman
625     
626     Editors were unaware the articles had been automatically generated.
627     
628     
629     Related paper by some of the same authors:
630   
631     Banerjee et al., \e{WikiKreator: Improving Wikipedia Stubs 
632     Automatically}. \href{https://siddbanpsu.github.io/publications/acl2015-banerjee-preprint.pdf}
633     {preprint}, accepted paper at ACL2015
634     
635     Elaborate classifier method to find suitable web resources for 
636     expanding stubs - but copying sentences wholesale from these into
637     articles landed the bot (User:MightyPepper) in a \href{https://en.wikipedia.org/wiki/Wikipedia:Contributor_copyright_investigations/Archive#2015}{contributor copyright investigation}\ldots
638     }
639 \end{frame}
640
641
642
643
644 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
645 \subsection{Gender on Wikipedia}
646 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
647
648 \begin{frame}
649    \centertext{6em}{Gender Beyond the Gap}
650   
651
652    \note{Aaron:
653
654      Research focused on understanding gender dynamics in Wikipedia
655      and their impact is another area of research that has continued
656      to expand this year. A number of high quality papers came out,
657      several of which analyzed how gender figures in the content of
658      the encyclopedias.
659      }
660  \end{frame}
661
662  \begin{frame}
663    \frametitle{It's a Man's Wikipedia?}
664    \larger \larger Wagner, Claudia; David Garcia; Mohsen Jadidi; and Markus
665 Strohmaier. 2015. \href{https://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10585}{``\e{It's a Man's Wikipedia? Assessing
666   Gender Inequality in an Online Encyclopedia}.''} Ninth International
667 AAAI Conference on Web and Social Media (ICWSM).
668
669  \end{frame}
670
671  \begin{frame}
672
673    \frametitle{It's a Man's Wikipedia: Motivation}
674
675    \begin{itemize}
676      \larger \larger \larger
677    \item We know there's a gender gap.
678    \item Need for more multidimensional analysis of \e{how gender is
679      represented in content of articles across Wikipedias}.
680    \end{itemize}
681
682    \note{
683 }
684  \end{frame}
685
686  \begin{frame}
687
688    \frametitle{It's a Man's Wikipedia: Methods}
689
690    \begin{itemize}
691    \larger \larger \larger
692    \item Use data from three sources (Freebase, ``Human
693      Accomplishment,'' and Pantheon) as baselines for comparison with
694      six Wikipedias (EN, ES, DE, FR, IT, RU).
695    \item Examine multiple potential forms of bias: coverage,
696      structure, lexical characteristics, visibility. 
697    \end{itemize}
698
699  \end{frame}
700
701  \begin{frame}
702    \frametitle{It's a Man's Wikipedia: Results}
703
704    \centering
705    \visible<2->{
706    \includegraphics[width=\textwidth]{figures/mans_wikipedia_fig.pdf}
707    }
708  \note{
709    \e{Some key findings:}
710    \begin{itemize}
711    \larger \larger
712  \item 1: Coverage of women (\# articles, length) in WPs is generally
713    better than other sources.
714  \item 2: Articles about women tend to be less centrally connected in
715    the network of articles than articles about men (Smurfette!)
716  \item 3: (\e{viz}) Content of articles about women uses different words
717    than those about men. Much higher incidence of language related to
718    family, gender, and relationships.
719    \end{itemize}
720 }
721  \end{frame}
722
723 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
724 \subsection{Using Wikipedia in Education} % TODO Fix title
725 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
726
727 \begin{frame}
728    \centertext{6em}{Adopting Wikipedia as a Teaching Tool}
729   
730    \note{Aaron:
731
732      Research focused on understanding how Wikipedia and related
733      resources are adopted for classroom teaching. Growing area of
734      work, still somewhat preliminary findings. Nonetheless, some of
735      the papers in this domain make for entertaining reading...
736      }
737  \end{frame}
738
739  \begin{frame}
740    \frametitle{WP and the Wisdom of Crowds}
741
742    \larger \larger Barnhisel, Greg and Marcia
743    Rapchak. 2014. \href{http://ur1.ca/n5919}{``\e{Wikipedia and the Wisdom of Crowds: A Student
744      Project}.''} Communications in Information Literacy 8(1):
745    145-159. doi:10.7548/cil.v8i1.249.
746 \end{frame}
747
748
749 \begin{frame}
750    \frametitle{WP and the Wisdom of Crowds: Motivation}
751    \begin{itemize}
752      \larger \larger
753    \item Students use Wikipedia uncritically. Don't understand how low
754      quality much of the information may be or how it may be
755      manipulated.
756    \item Professor (author) believes that WP is full of dubious
757      information. Wants to unmask that for his students.
758    \item Through more in-depth exposure, students may understand the
759      limitations of collaborative, open systems of knowledge production.
760    \end{itemize}
761 \end{frame}
762
763
764 \begin{frame}
765    \frametitle{WP and the Wisdom of Crowds: Methods}
766
767    \begin{itemize}
768      \larger \larger
769    \item Require a Senior (college) composition class to work on
770      editing WP articles (together and individually) throughout the
771      semester. 
772    \item Incorporate assignments to help students learn about the
773      history of WP as well as how to use it.
774    \item Require students to reflect on their experiences in writing.
775    \item Require students to analyze the pros/cons of open
776      collaborative writing in their final projects.
777    \end{itemize}
778
779 \note{ 
780   This is all sort of fabulously in-line with exactly what the WikiEd
781   Foundation recommends instructors do (!).
782 }
783 \end{frame}
784
785
786 \begin{frame}
787    \frametitle{WP and the Wisdom of Crowds: Results}
788
789 \centering
790 \begin{quote}
791   \e{Both sources [crowds and experts] have different merits... My
792     life experience since class pulls me in favor of the wisdom of the
793     crowd. In my recent studies, I have found that I can learn much
794     more from a group of my peers than from a single expert.\\ \hfill
795     --- Student 1}
796 \end{quote}
797
798 \note{ Not exactly what the instructor expected. Essentially, both he
799   and the students came away with much more nuanced, and positive,
800   views of the relative merits, possibilities, and limitations of open
801   collaborative knowledge production. A happy ending :) }
802 \end{frame}
803 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
804
805
806
807 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
808 \section{Conclusion}
809 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
810
811 \subsection{Meta-Analyses}
812
813 \begin{frame}
814
815   \frametitle{Meta-Analyses}
816
817   \begin{itemize}
818
819     \larger \larger
820   \item Mesgari, Mostafa and Okoli, Chitu and Mehdi, Mohamad and Nielsen, Finn Årup and Lanamäki, Arto. 2014. \href{http://spectrum.library.concordia.ca/978652/}{``The sum of all human knowledge": A systematic review of scholarly research on the content of Wikipedia''}. Journal of the Association for Information Science and Technology. 
821
822   \item Miquel-Ribé,
823     Marc. 2015. \href{https://www.aaai.org/ocs/index.php/ICWSM/ICWSM15/paper/view/10645}{``User
824       Engagement on Wikipedia, A Review of Studies of Readers and
825       Editors.''} Ninth International AAAI Conference on Web and
826     Social Media (ICWSM).
827
828   \end{itemize}
829
830 \end{frame}
831
832 %% SLIDE: Other Resources
833 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
834 \begin{frame}{More Resources}
835
836   \begin{itemize}
837     \larger \larger
838   \item \e{Wikimedia Research Newsletter} [[:meta:Research:Newsletter]] / @WikiResearch
839   \item \e{WikiSym/OpenSym} (This August in San Francisco!)
840   \item \e{WikiPapers Repository} [http://wikipapers.referata.com]
841   \item \e{Much More}
842   \end{itemize}
843
844   {\centering 
845     \includegraphics[width=0.25\textwidth]{figures/Wikimedia_Research_Newsletter_Logo.png}
846
847   }
848
849   \note{Those are my six exemplary studies from the past year. 
850
851     There has been just tons and tons of work in this area. Trying to
852     talk about this in 20 minutes strikes me as increasingly crazy
853     every year I try to do it.
854
855     The most important source, now going for a couple years, is the
856     Wikimedia Research Newsletter which is published monthly in the (English)
857     Signpost and syndicated on the Wikimedia Research.
858
859     But there are other resources as well. And I encourage you to get
860     involved.}
861
862 \end{frame}
863
864
865 \end{document}
866
867
868 %  LocalWords:  xshift yshift makopurple Tilman wikipedia Scopus Hu
869 %  LocalWords:  Ronen Gonçalves Vespignani Hidalgo al Galician Ranjan
870 %  LocalWords:  eigenvector Warncke Terveen Hecht underproduced NEJM
871 %  LocalWords:  Hwang Engl doi Kräenbring WebMD WikiProject Mohsen
872 %  LocalWords:  Jadidi Markus Strohmaier Wikipedias WPs Smurfette
873 %  LocalWords:  Barnhisel Rapchak WikiEd Mesgari Mostafa Okoli Chitu
874 %  LocalWords:  Mehdi Mohamad Årup Lanamäki Arto Miquel Ribé OpenSym
875 %  LocalWords:  WikiPapers

Benjamin Mako Hill || Want to submit a patch?