BumpsFitting.py @ 7988501

ESS_GUIESS_GUI_DocsESS_GUI_batch_fittingESS_GUI_bumps_abstractionESS_GUI_iss1116ESS_GUI_iss879ESS_GUI_iss959ESS_GUI_openclESS_GUI_orderingESS_GUI_sync_sascalccostrafo411magnetic_scattrelease-4.1.1release-4.1.2release-4.2.2ticket-1009ticket-1094-headlessticket-1242-2d-resolutionticket-1243ticket-1249ticket885unittest-saveload

Last change on this file since 7988501 was 7988501, checked in by jhbakker, 8 years ago
Data1D class changed to include SESANS Data format
Property mode set to `100644`
File size: 13.6 KB

Line
1	"""
2	BumpsFitting module runs the bumps optimizer.
3	"""
4	import os
5	from datetime import timedelta, datetime
6
7	import numpy
8
9	from bumps import fitters
10	try:
11	from bumps.options import FIT_CONFIG
12	# Default bumps to use the Levenberg-Marquardt optimizer
13	FIT_CONFIG.selected_id = fitters.LevenbergMarquardtFit.id
14	def get_fitter():
15	return FIT_CONFIG.selected_fitter, FIT_CONFIG.selected_values
16	except:
17	# CRUFT: Bumps changed its handling of fit options around 0.7.5.6
18	# Default bumps to use the Levenberg-Marquardt optimizer
19	fitters.FIT_DEFAULT = 'lm'
20	def get_fitter():
21	fitopts = fitters.FIT_OPTIONS[fitters.FIT_DEFAULT]
22	return fitopts.fitclass, fitopts.options.copy()
23
24
25	from bumps.mapper import SerialMapper, MPMapper
26	from bumps import parameter
27	from bumps.fitproblem import FitProblem
28
29	from sas.sascalc.fit.AbstractFitEngine import FitEngine
30	from sas.sascalc.fit.AbstractFitEngine import FResult
31	from sas.sascalc.fit.expression import compile_constraints
32
33	class Progress(object):
34	def __init__(self, history, max_step, pars, dof):
35	remaining_time = int(history.time[0]*(float(max_step)/history.step[0]-1))
36	# Depending on the time remaining, either display the expected
37	# time of completion, or the amount of time remaining. Use precision
38	# appropriate for the duration.
39	if remaining_time >= 1800:
40	completion_time = datetime.now() + timedelta(seconds=remaining_time)
41	if remaining_time >= 36000:
42	time = completion_time.strftime('%Y-%m-%d %H:%M')
43	else:
44	time = completion_time.strftime('%H:%M')
45	else:
46	if remaining_time >= 3600:
47	time = '%dh %dm'%(remaining_time//3600, (remaining_time%3600)//60)
48	elif remaining_time >= 60:
49	time = '%dm %ds'%(remaining_time//60, remaining_time%60)
50	else:
51	time = '%ds'%remaining_time
52	chisq = "%.3g"%(2*history.value[0]/dof)
53	step = "%d of %d"%(history.step[0], max_step)
54	header = "=== Steps: %s chisq: %s ETA: %s\n"%(step, chisq, time)
55	parameters = ["%15s: %-10.3g%s"%(k,v,("\n" if i%3==2 else " \| "))
56	for i,(k,v) in enumerate(zip(pars,history.point[0]))]
57	self.msg = "".join([header]+parameters)
58
59	def __str__(self):
60	return self.msg
61
62
63	class BumpsMonitor(object):
64	def __init__(self, handler, max_step, pars, dof):
65	self.handler = handler
66	self.max_step = max_step
67	self.pars = pars
68	self.dof = dof
69
70	def config_history(self, history):
71	history.requires(time=1, value=2, point=1, step=1)
72
73	def __call__(self, history):
74	if self.handler is None: return
75	self.handler.set_result(Progress(history, self.max_step, self.pars, self.dof))
76	self.handler.progress(history.step[0], self.max_step)
77	if len(history.step)>1 and history.step[1] > history.step[0]:
78	self.handler.improvement()
79	self.handler.update_fit()
80
81	class ConvergenceMonitor(object):
82	"""
83	ConvergenceMonitor contains population summary statistics to show progress
84	of the fit. This is a list [ (best, 0%, 25%, 50%, 75%, 100%) ] or
85	just a list [ (best, ) ] if population size is 1.
86	"""
87	def __init__(self):
88	self.convergence = []
89
90	def config_history(self, history):
91	history.requires(value=1, population_values=1)
92
93	def __call__(self, history):
94	best = history.value[0]
95	try:
96	p = history.population_values[0]
97	n,p = len(p), numpy.sort(p)
98	QI,Qmid, = int(0.2n),int(0.5n)
99	self.convergence.append((best, p[0],p[QI],p[Qmid],p[-1-QI],p[-1]))
100	except:
101	self.convergence.append((best, best,best,best,best,best))
102
103
104	# Note: currently using bumps parameters for each parameter object so that
105	# a SasFitness can be used directly in bumps with the usual semantics.
106	# The disadvantage of this technique is that we need to copy every parameter
107	# back into the model each time the function is evaluated. We could instead
108	# define reference parameters for each sas parameter, but then we would not
109	# be able to express constraints using python expressions in the usual way
110	# from bumps, and would instead need to use string expressions.
111	class SasFitness(object):
112	"""
113	Wrap SAS model as a bumps fitness object
114	"""
115	def __init__(self, model, data, fitted=[], constraints={},
116	initial_values=None, **kw):
117	self.name = model.name
118	self.model = model.model
119	self.data = data
120	if self.data.smearer is not None:
121	self.data.smearer.model = self.model
122	self._define_pars()
123	self._init_pars(kw)
124	if initial_values is not None:
125	self._reset_pars(fitted, initial_values)
126	self.constraints = dict(constraints)
127	self.set_fitted(fitted)
128	self.update()
129
130	def _reset_pars(self, names, values):
131	for k,v in zip(names, values):
132	self._pars[k].value = v
133
134	def _define_pars(self):
135	self._pars = {}
136	for k in self.model.getParamList():
137	name = ".".join((self.name,k))
138	value = self.model.getParam(k)
139	bounds = self.model.details.get(k,["",None,None])[1:3]
140	self._pars[k] = parameter.Parameter(value=value, bounds=bounds,
141	fixed=True, name=name)
142	#print parameter.summarize(self._pars.values())
143
144	def _init_pars(self, kw):
145	for k,v in kw.items():
146	# dispersion parameters initialized with _field instead of .field
147	if k.endswith('_width'): k = k[:-6]+'.width'
148	elif k.endswith('_npts'): k = k[:-5]+'.npts'
149	elif k.endswith('_nsigmas'): k = k[:-7]+'.nsigmas'
150	elif k.endswith('_type'): k = k[:-5]+'.type'
151	if k not in self._pars:
152	formatted_pars = ", ".join(sorted(self._pars.keys()))
153	raise KeyError("invalid parameter %r for %s--use one of: %s"
154	%(k, self.model, formatted_pars))
155	if '.' in k and not k.endswith('.width'):
156	self.model.setParam(k, v)
157	elif isinstance(v, parameter.BaseParameter):
158	self._pars[k] = v
159	elif isinstance(v, (tuple,list)):
160	low, high = v
161	self._pars[k].value = (low+high)/2
162	self._pars[k].range(low,high)
163	else:
164	self._pars[k].value = v
165
166	def set_fitted(self, param_list):
167	"""
168	Flag a set of parameters as fitted parameters.
169	"""
170	for k,p in self._pars.items():
171	p.fixed = (k not in param_list or k in self.constraints)
172	self.fitted_par_names = [k for k in param_list if k not in self.constraints]
173	self.computed_par_names = [k for k in param_list if k in self.constraints]
174	self.fitted_pars = [self._pars[k] for k in self.fitted_par_names]
175	self.computed_pars = [self._pars[k] for k in self.computed_par_names]
176
177	# ===== Fitness interface ====
178	def parameters(self):
179	return self._pars
180
181	def update(self):
182	for k,v in self._pars.items():
183	#print "updating",k,v,v.value
184	self.model.setParam(k,v.value)
185	self._dirty = True
186
187	def _recalculate(self):
188	if self._dirty:
189	self._residuals, self._theory \
190	= self.data.residuals(self.model.evalDistribution)
191	self._dirty = False
192
193	def numpoints(self):
194	return numpy.sum(self.data.idx) # number of fitted points
195
196	def nllf(self):
197	return 0.5numpy.sum(self.residuals()*2)
198
199	def theory(self):
200	self._recalculate()
201	return self._theory
202
203	def residuals(self):
204	self._recalculate()
205	return self._residuals
206
207	# Not implementing the data methods for now:
208	#
209	# resynth_data/restore_data/save/plot
210
211	class ParameterExpressions(object):
212	def __init__(self, models):
213	self.models = models
214	self._setup()
215
216	def _setup(self):
217	exprs = {}
218	for M in self.models:
219	exprs.update((".".join((M.name, k)), v) for k, v in M.constraints.items())
220	if exprs:
221	symtab = dict((".".join((M.name, k)), p)
222	for M in self.models
223	for k,p in M.parameters().items())
224	self.update = compile_constraints(symtab, exprs)
225	else:
226	self.update = lambda: 0
227
228	def __call__(self):
229	self.update()
230
231	def __getstate__(self):
232	return self.models
233
234	def __setstate__(self, state):
235	self.models = state
236	self._setup()
237
238	class BumpsFit(FitEngine):
239	"""
240	Fit a model using bumps.
241	"""
242	def __init__(self):
243	"""
244	Creates a dictionary (self.fit_arrange_dict={})of FitArrange elements
245	with Uid as keys
246	"""
247	FitEngine.__init__(self)
248	self.curr_thread = None
249
250	def fit(self, msg_q=None,
251	q=None, handler=None, curr_thread=None,
252	ftol=1.49012e-8, reset_flag=False):
253	# Build collection of bumps fitness calculators
254	models = [SasFitness(model=M.get_model(),
255	data=M.get_data(),
256	constraints=M.constraints,
257	fitted=M.pars,
258	initial_values=M.vals if reset_flag else None)
259	for M in self.fit_arrange_dict.values()
260	if M.get_to_fit()]
261	if len(models) == 0:
262	raise RuntimeError("Nothing to fit")
263	problem = FitProblem(models)
264
265	# TODO: need better handling of parameter expressions and bounds constraints
266	# so that they are applied during polydispersity calculations. This
267	# will remove the immediate need for the setp_hook in bumps, though
268	# bumps may still need something similar, such as a sane class structure
269	# which allows a subclass to override setp.
270	problem.setp_hook = ParameterExpressions(models)
271
272	# Run the fit
273	result = run_bumps(problem, handler, curr_thread)
274	if handler is not None:
275	handler.update_fit(last=True)
276
277	# TODO: shouldn't reference internal parameters of fit problem
278	varying = problem._parameters
279	# collect the results
280	all_results = []
281	for M in problem.models:
282	fitness = M.fitness
283	fitted_index = [varying.index(p) for p in fitness.fitted_pars]
284	param_list = fitness.fitted_par_names + fitness.computed_par_names
285	R = FResult(model=fitness.model, data=fitness.data,
286	param_list=param_list)
287	R.theory = fitness.theory()
288	R.residuals = fitness.residuals()
289	R.index = fitness.data.idx
290	R.fitter_id = self.fitter_id
291	# TODO: should scale stderr by sqrt(chisq/DOF) if dy is unknown
292	R.success = result['success']
293	if R.success:
294	R.stderr = numpy.hstack((result['stderr'][fitted_index],
295	numpy.NaN*numpy.ones(len(fitness.computed_pars))))
296	R.pvec = numpy.hstack((result['value'][fitted_index],
297	[p.value for p in fitness.computed_pars]))
298	R.fitness = numpy.sum(R.residuals**2)/(fitness.numpoints() - len(fitted_index))
299	else:
300	R.stderr = numpy.NaN*numpy.ones(len(param_list))
301	R.pvec = numpy.asarray( [p.value for p in fitness.fitted_pars+fitness.computed_pars])
302	R.fitness = numpy.NaN
303	R.convergence = result['convergence']
304	if result['uncertainty'] is not None:
305	R.uncertainty_state = result['uncertainty']
306	all_results.append(R)
307
308	if q is not None:
309	q.put(all_results)
310	return q
311	else:
312	return all_results
313
314	def run_bumps(problem, handler, curr_thread):
315	def abort_test():
316	if curr_thread is None: return False
317	try: curr_thread.isquit()
318	except KeyboardInterrupt:
319	if handler is not None:
320	handler.stop("Fitting: Terminated!!!")
321	return True
322	return False
323
324	fitclass, options = get_fitter()
325	steps = options.get('steps', 0)
326	if steps == 0:
327	pop = options.get('pop',0)*len(problem._parameters)
328	samples = options.get('samples', 0)
329	steps = (samples+pop-1)/pop if pop != 0 else samples
330	max_step = steps + options.get('burn', 0)
331	pars = [p.name for p in problem._parameters]
332	#x0 = numpy.asarray([p.value for p in problem._parameters])
333	options['monitors'] = [
334	BumpsMonitor(handler, max_step, pars, problem.dof),
335	ConvergenceMonitor(),
336	]
337	fitdriver = fitters.FitDriver(fitclass, problem=problem,
338	abort_test=abort_test, **options)
339	omp_threads = int(os.environ.get('OMP_NUM_THREADS','0'))
340	mapper = MPMapper if omp_threads == 1 else SerialMapper
341	fitdriver.mapper = mapper.start_mapper(problem, None)
342	#import time; T0 = time.time()
343	try:
344	best, fbest = fitdriver.fit()
345	except:
346	import traceback; traceback.print_exc()
347	raise
348	finally:
349	mapper.stop_mapper(fitdriver.mapper)
350
351
352	convergence_list = options['monitors'][-1].convergence
353	convergence = (2*numpy.asarray(convergence_list)/problem.dof
354	if convergence_list else numpy.empty((0,1),'d'))
355
356	success = best is not None
357	return {
358	'value': best if success else None,
359	'stderr': fitdriver.stderr() if success else None,
360	'success': success,
361	'convergence': convergence,
362	'uncertainty': getattr(fitdriver.fitter, 'state', None),
363	}
364

Note: See TracBrowser for help on using the repository browser.

SasView

source: sasview/src/sas/sascalc/fit/BumpsFitting.py @ 7988501

Download in other formats: