fixing a bug when a page is blanked
[mw] / src / mw / metadir.py
1 ###
2 # mw - VCS-like nonsense for MediaWiki websites
3 # Copyright (C) 2010  Ian Weller <ian@ianweller.org>
4 #
5 # This program is free software; you can redistribute it and/or modify
6 # it under the terms of the GNU General Public License as published by
7 # the Free Software Foundation; either version 2 of the License, or
8 # (at your option) any later version.
9 #
10 # This program is distributed in the hope that it will be useful,
11 # but WITHOUT ANY WARRANTY; without even the implied warranty of
12 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13 # GNU General Public License for more details.
14 #
15 # You should have received a copy of the GNU General Public License along
16 # with this program.  If not, see <http://www.gnu.org/licenses/>.
17 ###
18
19 import bzrlib.diff
20 import codecs
21 import ConfigParser
22 import json
23 import mw.api
24 import os
25 from StringIO import StringIO
26 import sys
27
28
29 class Metadir(object):
30
31     def __init__(self):
32         self.me = os.path.basename(sys.argv[0])
33         root = os.getcwd()
34         while True:
35             if '.mw' in os.listdir(root):
36                 self.root = root
37                 break
38             head = os.path.split(root)[0]
39             if head == root:
40                 self.root = os.getcwd()
41                 break
42             root = head
43         self.location = os.path.join(self.root, '.mw')
44         self.config_loc = os.path.join(self.location, 'config')
45         if os.path.isdir(self.location) and \
46            os.path.isfile(self.config_loc):
47             self.config = ConfigParser.RawConfigParser()
48             self.config.read(self.config_loc)
49         else:
50             self.config = None
51
52     def save_config(self):
53         with open(self.config_loc, 'wb') as config_file:
54             self.config.write(config_file)
55
56     def create(self, api_url):
57         # create the directory
58         if os.path.isdir(self.location):
59             print '%s: you are already in a mw repo' % self.me
60             sys.exit(1)
61         else:
62             os.mkdir(self.location, 0755)
63         # metadir versioning
64         fd = file(os.path.join(self.location, 'version'), 'w')
65         fd.write('1') # XXX THIS API VERSION NOT LOCKED IN YET
66         fd.close()
67         # create config
68         self.config = ConfigParser.RawConfigParser()
69         self.config.add_section('remote')
70         self.config.set('remote', 'api_url', api_url)
71         self.save_config()
72         # create cache/
73         os.mkdir(os.path.join(self.location, 'cache'))
74         # create cache/pagedict
75         fd = file(os.path.join(self.location, 'cache', 'pagedict'), 'w')
76         fd.write(json.dumps({}))
77         fd.close()
78         # create cache/pages/
79         os.mkdir(os.path.join(self.location, 'cache', 'pages'), 0755)
80
81     def pagedict_add(self, pagename, pageid, currentrv):
82         fd = file(os.path.join(self.location, 'cache', 'pagedict'), 'r+')
83         pagedict = json.loads(fd.read())
84         pagedict[pagename] = {'id': int(pageid), 'currentrv': int(currentrv)}
85         fd.seek(0)
86         fd.write(json.dumps(pagedict))
87         fd.truncate()
88         fd.close()
89
90     def get_pageid_from_pagename(self, pagename):
91         fd = file(os.path.join(self.location, 'cache', 'pagedict'), 'r')
92         pagedict = json.loads(fd.read())
93         if pagename in pagedict.keys():
94             return pagedict[pagename]
95         else:
96             return None
97
98     def pages_add_rv(self, pageid, rv):
99         pagefile = os.path.join(self.location, 'cache', 'pages', str(pageid))
100         fd = file(pagefile, 'w+')
101         pagedata_raw = fd.read()
102         if pagedata_raw == '':
103             pagedata = {}
104         else:
105             pagedata = json.loads(pagedata_raw)
106         rvid = int(rv['revid'])
107         pagedata[rvid] = {
108                 'user': rv['user'],
109                 'timestamp': rv['timestamp'],
110         }
111         if '*' in rv.keys():
112             pagedata[rvid]['content'] = rv['*']
113         fd.seek(0)
114         fd.write(json.dumps(pagedata))
115         fd.truncate()
116         fd.close()
117
118     def pages_get_rv_list(self, pageid):
119         pagefile = os.path.join(self.location, 'cache', 'pages',
120                                 str(pageid['id']))
121         fd = file(pagefile, 'r')
122         pagedata = json.loads(fd.read())
123         rvs = [int(x) for x in pagedata.keys()]
124         rvs.sort()
125         return rvs
126
127     def pages_get_rv(self, pageid, rvid):
128         pagefile = os.path.join(self.location, 'cache', 'pages',
129                                 str(pageid['id']))
130         fd = file(pagefile, 'r')
131         pagedata = json.loads(fd.read())
132         return pagedata[str(rvid)]
133
134     def working_dir_status(self, files=None):
135         status = {}
136         check = []
137         if files == None or files == []:
138             for root, dirs, files in os.walk(self.root):
139                 if root == self.root:
140                     dirs.remove('.mw')
141                 for name in files:
142                     check.append(os.path.join(root, name))
143         else:
144             for file in files:
145                 check.append(os.path.join(os.getcwd(), file))
146         check.sort()
147         for full in check:
148             name = os.path.split(full)[1]
149             if name[-5:] == '.wiki':
150                 pagename = mw.api.filename_to_pagename(name[:-5])
151                 pageid = self.get_pageid_from_pagename(pagename)
152                 if not pageid:
153                     status[os.path.relpath(full, self.root)] = '?'
154                 else:
155                     rvid = self.pages_get_rv_list(pageid)[-1]
156                     rv = self.pages_get_rv(pageid, rvid)
157                     cur_content = codecs.open(full, 'r', 'utf-8').read()
158                     if (len(cur_content) != 0) and (cur_content[-1] == '\n'):
159                         cur_content = cur_content[:-1]
160                     if cur_content != rv['content']:
161                         status[os.path.relpath(full, self.root)] = 'U'
162         return status
163
164     def diff_rv_to_working(self, pagename, oldrvid=0, newrvid=0):
165         # oldrvid=0 means latest fetched revision
166         # newrvid=0 means working copy
167         filename = mw.api.pagename_to_filename(pagename) + '.wiki'
168         pageid = self.get_pageid_from_pagename(pagename)
169         if not pageid:
170             raise ValueError('page named %s has not been fetched' % pagename)
171         else:
172             if oldrvid == 0:
173                 oldrvid = self.pages_get_rv_list(pageid)[-1]
174             oldrv = self.pages_get_rv(pageid, oldrvid)
175             oldname = 'a/%s (revision %i)' % (filename, oldrvid)
176             old = [i + '\n' for i in oldrv['content'].split('\n')]
177             if newrvid == 0:
178                 cur_content = codecs.open(filename, 'r', 'utf-8').read()
179                 if (len(cur_content) != 0) and (cur_content[-1] == '\n'):
180                     cur_content = cur_content[:-1]
181                 newname = 'b/%s (working copy)' % filename
182                 new = [i + '\n' for i in cur_content.split('\n')]
183             else:
184                 newrv = self.pages_get_rv(pageid, newrvid)
185                 newname = 'b/%s (revision %i)' % (filename, newrvid)
186                 new = [i + '\n' for i in newrv['content'].split('\n')]
187             diff_fd = StringIO()
188             bzrlib.diff.internal_diff(oldname, old, newname, new, diff_fd)
189             diff_fd.seek(0)
190             diff = diff_fd.read()
191             if diff[-1] == '\n':
192                 diff = diff[:-1]
193             return diff

Benjamin Mako Hill || Want to submit a patch?