14d60269526e0819a6852bb05dca0a087865767f
[wikipedia-api-cdsw] / wikipedia1-2.py
1 import requests
2
3 # raw string:
4 # ?action=query&prop=revisions&titles=Python_(programming_language)&rvlimit=100&rvprop=timestamp|user&format=json')
5
6 # parameter version which makes a little more sense
7 parameters = {'action' : 'query',
8               'prop' : 'revisions',
9               'titles' : 'Python (programming language)',
10               'rvlimit' : 100,
11               'rvprop' : "timestamp|user",
12               'format' : 'json',
13               'continue' : ''}
14
15 while True:
16     wp_call = requests.get('https://en.wikipedia.org/w/api.php', params=parameters)
17     response = wp_call.json()
18     print(parameters)
19     print(response)
20
21     for page_id in response["query"]["pages"].keys():
22         page_title = response["query"]["pages"][page_id]["title"]
23         revisions = response["query"]["pages"][page_id]["revisions"]
24
25         for rev in revisions:
26             print(page_title + "\t" + rev["user"] + "\t" + rev["timestamp"])
27
28     if 'continue' in response:
29         parameters.update(response['continue'])
30     else:
31         break
32             

Benjamin Mako Hill || Want to submit a patch?