98fd1297c7801663587972c5cc44b2d0f0f9859b
[wikipedia-api-cdsw] / wikipedia1-2.py
1 import requests
2
3 # raw string:
4 # ?action=query&prop=revisions&titles=Python_(programming_language)&rvlimit=100&rvprop=timestamp|user&format=json')
5
6 # parameter version which makes a little more sense
7 parameters = {'action' : 'query',
8               'prop' : 'revisions',
9               'titles' : 'Python (programming language)',
10               'rvlimit' : 100,
11               'rvprop' : "timestamp|user",
12               'format' : 'json',
13               'continue' : ''}
14
15 # run a white true loop
16 while True:
17     wp_call = requests.get('https://en.wikipedia.org/w/api.php', params=parameters)
18     response = wp_call.json()
19     print(parameters)
20     print(response)
21
22     for page_id in response["query"]["pages"].keys():
23         page_title = response["query"]["pages"][page_id]["title"]
24         revisions = response["query"]["pages"][page_id]["revisions"]
25
26         for rev in revisions:
27             print(page_title + "\t" + rev["user"] + "\t" + rev["timestamp"])
28
29     if 'continue' in response:
30         parameters.update(response['continue'])
31     else:
32         break
33             

Benjamin Mako Hill || Want to submit a patch?