-                      rf5b9a6b
+                      rcb6ecf4
 from pyopencl import mem_flags as mf
 from . import gen
+from . import generate
 F64_DEFS = """\
 …
     so models can be defined without using too many resources.
     """
     source, info = gen.make(kernel_module)
+    source, info = generate.make(kernel_module)
     ## for debugging, save source to a .cl file, edit it, and reload as model
     #open(info['name']+'.cl','w').write(source)
 …
     """
     dtype = np.dtype(dtype)
     if dtype==gen.F64 and not all(has_double(d) for d in context.devices):
+    if dtype==generate.F64 and not all(has_double(d) for d in context.devices):
         raise RuntimeError("Double precision not supported for devices")
     header = F64_DEFS if dtype == gen.F64 else ""
     if dtype == gen.F32:
         source = gen.use_single(source)
+    header = F64_DEFS if dtype == generate.F64 else ""
+    if dtype == generate.F32:
+        source = generate.use_single(source)
     # Note: USE_SINCOS makes the intel cpu slower under opencl
     if context.devices[0].type == cl.device_type.GPU:
 …
     is an optional extension which may not be available on all devices.
     """
     def __init__(self, source, info, dtype=gen.F32):
+    def __init__(self, source, info, dtype=generate.F32):
         self.info = info
         self.source = source
 …
         if self.program is None:
             self.program = environment().compile_program(self.info['name'],self.source, self.dtype)
         kernel_name = gen.kernel_name(self.info, input.is_2D)
+        kernel_name = generate.kernel_name(self.info, input.is_2D)
         kernel = getattr(self.program, kernel_name)
         return GpuKernel(kernel, self.info, input)
 …
     buffer will be released when the data object is freed.
     """
     def __init__(self, q_vectors, dtype=gen.F32):
+    def __init__(self, q_vectors, dtype=generate.F32):
         env = environment()
         self.nq = q_vectors[0].size
 …
     def __call__(self, pars, pd_pars, cutoff=1e-5):
         real = np.float32 if self.input.dtype == gen.F32 else np.float64
+        real = np.float32 if self.input.dtype == generate.F32 else np.float64
         fixed = [real(p) for p in pars]
         cutoff = real(cutoff)

Note: See TracChangeset for help on using the changeset viewer.

SasView

Changeset cb6ecf4 in sasmodels for sasmodels/gpu.py

Legend:

sasmodels/gpu.py

Download in other formats: