Elegant Mathematics Ltd

Scientific Innovation for Industrial Applications

     

Fluid Dynamics

Numerische Modellierung der fast allen physikalischen Erscheinungen, die mit der Übertragung der Materie verbunden sind, wird von Elegant Mathematics Ltd. nicht nur theoretisch erforscht, sondern auch in die professionelle Software implementiert, welche industriell eingeführt wird. Spektrum unserer mathematischen Lösungen erstreckt sich von der Konstruktion der zähflüssigen Modelle auf Grundlage der Lame-Gleichung (Programmpaket EMLibHMatrix), umfassend fast alle gängige Konvektions-Diffusions-Modelle, bis zur Behandlung der meisten Modelle der Unter- und Überschallgasdynamik mit Anlehnung an die Boltzmann-Gleichung (Programmpaket EMBoltzmann), beruhend auf den modernsten wissenschaftlichen Entwicklungen im Gebiet der Finite-Elemente und der adaptiven Gitterverfahren (Programmpaket EMLibGrid).

Elegant's Solvers sind äußerst stabil und können daher schlechtkonditionierte Aufgaben lösen, sowie auch die Aufgaben, welche mit keinem anderen bekannten Verfahren binnen denkbarer Bearbeitungszeit gelöst werden können (Programmpakete EMLibSparse und EMLibIter).



Unser neuer Algorithmus für approximative Lösung der Boltzmann-Gleichung beruht auf der mehrdimensionalen Multivektorzerlegung und ermöglicht die Modellierungsprobleme im Unterschall- sowie Schallbereich mit derselben Geschwindigkeit zu berechnen, wie die meisten Algorithmen es tun, die auf der Navier-Stokes-Annäherung basieren. Unterdessen erlaubt die Modellierung nach Boltzmann, die Genauigkeit der erhaltenen physikalischen Ergebnisse wesentlich zu verbessern.

Indem Sie die numerischen Aufgaben der Unterschallgasdynamik für vorgegebene Form des Flugapparates, Stromgeschwindigkeit und Angriffswinkel lösen, lassen Sie das vollständige Feld der Turbulenz und sämtliche Kräfte berechnen, die auf das zu untersuchende Objekt wirken. Aufgrund dieser Größen kann man über das Verhalten des Flugapparates in verschiedenen Abschnitten seiner Flugbahn erfahren. Wenn es eine Reihe von Grundgeometrien des Flugapparates gibt, so kann man für jede von denen ihre technischen Charakteristiken vorhersagen und danach diejenige Geometrie auswählen, die am besten zutrifft.

Mehr noch, wenn die optimale Verteilung der gegen den Flügel wirkenden Kräfte bekannt ist, so können Sie die Flügelform entsprechend optimieren, indem Sie das Programmpaket EMLibMinimize benutzen, ohne dass Sie die große Anzahl von natürlichen Versuchen durchführen müssen.

Unsere Algorithmen finden Anwendung in allen Stadien der Entwicklung von Schraubenpropellern und Verdichterturbinen.




Es ist oft schwierig und manchmal sogar kaum möglich, die richtige Form der Schraubenblätter vorauszusagen. Unterdessen können sich die praktische Auslegung und Effektivitätsprüfung für diese oder jene Blattgeometrie als unwirtschaftlich erweisen, weil der große Zeit- und Geldaufwand damit verbunden sind.

Aufgrund der vorgegebenen Geometrie des Schraubenpropellers, der Umgebungstemperatur und der Geschwindigkeit der Anlaufströmung liefern Ihnen unsere Algorithmen den Kompressionswirkungsgrad (im Falle der Turbinen) bzw. den Freifahrtwirkungsgrad (im Falle der Propeller). Somit werden Sie für jede Form der Turbinenschaufel bzw. des Schraubenblattes seine Charakteristiken ohne Aufbau des teueren Prüfstandes ermitteln und seine geometrischen Parameter optimieren können.
Mittels unserer adaptiven Gitteralgorithmen für bewegliche Grenzen (Programmpaket EMLibGrid) erhalten Sie sowohl die komplette Veranschaulichung der Gas- oder Flüssigkeitsbewegung als auch die Größen aller Kräfte und Energieübertragungen auf der Grenze zwischen der strömenden Substanz und dem starren Körper. Wir schlagen außerdem vor, die Suche nach der besten Form der Turbinenschaufel zu automatisieren. Dabei genügte es, die Zielfunktion (z.B. den Wirkungsgrad der Turbine), die jeweiligen Beschränkungen (z.B. die Bedingung auf die Unterschallgeschwindigkeit) und die Parameter des Suchraumes (z.B. einige Referenzpunkte der Spline-Interpolation für die Schaufeloberfläche, vgl. EMLibSmooth) anzugeben. Die optimale Geometrie Ihrer Turbinenkonstruktion würde dann mit unserem Programmpaket EMLibMinimize automatisch gefunden.

Nach dem Sie die aus der Sicht von Gas- oder Hydrodynamik optimalen Werte für die Geometrie der Turbinenschaufeln bekommen haben, werden Sie mit der Herstellungsoptimierung derjenigen konfrontiert, damit die Schaufeln maximale Haltbarkeit und Langlebigkeit erweisen. In diesem Fall kommen wir Ihnen wieder zur Hilfe: wir modellieren für Ihre Schaufeln aufgrund der Lame-Gleichung die Größen der nichtelastischen Metallverformung, indem wir das Programmpaket EMLibHMatrix einsetzen. Dies erlaubt Ihnen, eine effektive Strategie für das Gesenkschmieden Ihrer Bauteile auszuarbeiten, was das Risiko der Fissuren, Durchbrüche und anderen Fertigungsdefekte verringert. Als Resultat werden die Haltbarkeit und Zuverlässigkeit der Verdichterturbinen steigen.


Unsere Algorithmen finden erfolgreiche Anwendung in der numerischen Modellierung der Hyperschallströmung von Gasen nahe bei der Kreisbahngeschwindigkeit oder auf die Strömungen mit stark turbulenten Kennzahlen. Unsere Modellierung beruht auf der diskretisierten Boltzmann-Gleichung, die wir mit determiniertem Verfahren anhand der Programmpakete EMBoltzmann, EMParBoltzmann oder EMGPUBoltzmann lösen. Mit Hilfe dieser Programme kann man folgendes berechnen:
  • oberflächliche Temperaturzustände für die Landeapparate bei ihrem Anlaufen in die dichten Atmosphärenschichten
  • Überschallströmungen in den Verdichterkomplexen
  • Luftstromablösungen am Tragflügel,
sowie auch viele andere wichtige physikalische Effekte. Mathematisches Modell, das den Boltzmann-Gleichungen zugrunde gelegt ist, ermöglicht die Simulation beliebiger Stoßwellen und lässt keine signifikante Verzerrung des Ergebnisses bei großen M-Zahlen zu.
Die aufgrund der dreidimensionalen Boltzmann-Gleichung realisierte Modellierung des Verbrennungsprozesses lässt uns die Optimierung Ihres Düsentriebwerkes (des Ram- oder Scramjet) anbieten.

Für numerische Simulationen solcher Art schlagen wir vor, einen umfangreichen Satz von verschiedenen Gittern und mathematischen Algorithmen zu verwenden, welche die Eigenschaften dieser Gitter ausnutzen, u.zw.:
  • gleichmäßige Tensorgitter mit Anlehnung an die Toeplitz-Eingenschaft der daraus entstehenden Matrixstrukturen und Anwendung der schnellen Fourier-Transformation
  • ungleichmäßige Tensorgitter mit Anwendung der Kronecker-Matrixstrukturen
zur Modellierung im Hodographraum (Programmpaket EMLibMDD);
  • adaptive Gitter auf der Basis von Tetraedern
  • netzlose oder duale Gitter auf der Basis der Delone-Zerlegung
zur Diskretisierung im physikalischen Koordinatenraum (Programmpaket EMLibGrid);
  • mehrdimensionale Gitter höherer Ordnung
zur genaueren Beschreibung der Randelemente (Programmpaket EMLibGrid).

Wave Simulation

Direkte Probleme aufgrund der Maxwell-Gleichungen

I. Numerische Modellierung in der Magnetostatik für apriorische Bestimmung des Magnetfeldes um die Elektromagneten

Solche Modellierung ermöglicht, die Charakteristiken des Magnetfeldes für die Magnetspule oder für das supraleitende Solenoid bekannter Form ohne Aufbau eines Prüfstandes zu ermitteln.
Nachdem die Modellaufgabe mit verschiedenen Eingangsparametern (wie etwa Abmessungsverhältnisse, Spulenwindungszahl u.ä.) mehrmalig gelöst wird, kann man die Optimalwerte dieser Parameter bezüglich des Wirkungsgrades oder einer anderen Charakteristik ausrechnen. Oft ist der physikalische Versuch mit dem Aufbau des Prüfstandes recht mühevoll und finanziell ungünstig. In einigen Fällen kommt der Prüfstand überhaupt nicht in Frage, wenn sich der Kunde nur die Fertigung eines einzigen Magnetes mit festen Parametern erlauben kann. Unter solchen Umständen werden numerische Modellierung und Parameteroptimierung des Magnetbauteiles durchgeführt, bevor dieses ausgelegt und gefertigt wird.
Wir können außerdem die Automatisierung des Suchprozesses für das bestmögliche Magnetbauteil anbieten. Dabei reicht es aus, die Zielfunktion (z.B. Wirkungsgrad), die zu variierenden Parameter (z.B. Drahtstärke, Spulenwindungszahl etc.) und ihre Wertebereiche anzugeben. Unser Programmpaket EMLibMinimize findet dann die optimale Auslegung Ihres Magnetbauteiles vollautomatisch.

Bei der Lösung der geschilderten Probleme verwenden wir das BEM-FEM Verfahren. Somit wird das Dielektrikum mit den Finite-Elementen und die Oberfläche der elektroleitenden Werkstoffe mit den Rand-Elementen modelliert. Dies erlaubt uns die Systeme mit den sich bewegenden Bauteilen (z.B. rotierenden Magnetkern, bewegliches Elektromagnetventil etc.) effektiver und genauer zu berechnen. BEM-FEM Verfahren liefert die genaueste Beschreibung für die gegenseitige Bewegung der elektroleitenden Bauteile und ruft keine großen numerischen Fehler bei der Umrechung des Gitters hervor, im Gegenteil zu lauterem FEM.

II. Numerische Modellierung von Radaren und Radarunsichtbarkeit


Für erfolgreiche Behandlung dieser Aufgaben gilt es die sich weit erstreckenden räumlichen Gebiete zu diskretisieren, so dass die Schrittweite der Diskretisierung wesentlich kleiner als die Wellenlänge der Wellenstrahlung ist. Derartige Aufgabenstellung erfordert die Lösung der riesigen dünnbesetzten linearen Gleichungssysteme. Selbst die Systemmatrix lässt sich öfters nicht im Arbeitsspeicher des Superrechners unterbringen. Deshalb haben wir dafür spezielle Parallelalgorithmen entwickelt (Programmpakete mit Vermerken MPP und GPU) sowie die den Festplattenspeicher ausnutzenden Algorithmen (Programmpakete mit Vermerken Out-of-Core).

Für die Lösung der superriesigen Gleichungssysteme werden die neusten Methoden der numerischen Linearalgebra angewendet, welche in unserem Unternehmen ausgearbeitet werden. Diese Methoden ermöglichen, die unstrukturierten linearen Gleichungssysteme (Programmpaket EMLibSparse) sowie die strukturierten linearen Gleichungssysteme mit den Kronecker- und Tensor-Strukturen (Programmprodukt EMLibMDD) zu lösen, wobei sich die Aufgaben mit einigen Millionen Unbekannten in wenigen Sekunden auf dem Notebook und die mit einigen Milliarden Unbekannten binnen absehbarer Zeit auf den Massenparallel-Superrechnern bearbeiten lassen.


Das Programmpaket LRA_CDENSE von Elegant Mathematics Inc., der Vorgängerin unserer Firma, wurde vom Konzern Lockheed Martin zur Modellierung der vom Flugzeug reflektierten Radiostrahlung eingesetzt. Die relative Wellenzahl in den damaligen Aufgaben überschritt 500. Gegenwärtig kann man solche Modellierung mit Hilfe von unseren Programmpaketen EMLibIter, EMLibSparse, EMLibHMatrix auf den Singleprozessor- und EMParLibIter, EMParLibSparse auf den Massenparallel-Rechnern durchführen.

Während der letzten 17 Jahre haben sich fachliche Traditionen gebildet, die modernen wissenschaftlichen Verfahren zur Lösung der schlecht konditionierten linearen Gleichungssysteme zu benutzen. Dies erlaubt der Firma Elegant Mathematics Ltd., an der Entwicklung von Radarschirmen und Mastantennen für verschiedene Luft- und Weltraumprojekte teilzunehmen.

Inverse Probleme aufgrund der Maxwell-Gleichungen

I. Nicht destruktive Ultraschalldiagnostik, Tomografieaufgaben und akustische Probleme der geologischen Erkundung


Elegant Mathematics Ltd. hilft Ihnen, die räumliche Struktur des 3-dimensionalen Objektes aufgrund von Reflexion und Absorption der Schallwellen an seinen Inhomogenitäten ohne Berücksichtigung der Interferenz zu ermitteln.
Die zu lösenden Aufgaben lassen sich in zwei Grundklassen einteilen.
  • Das zu untersuchende Objekt befindet sich zwischen dem Strahler und Empfänger, wobei die Wellenreflexion an den räumlichen Inhomogenitäten nicht betrachtet wird. Typische Anwendungen sind hierbei die Aufgaben der medizinischen Tomografie und teilweise der nicht destruktiven Ultraschalldiagnostik von Werkstoffen.
  • Strahler und Empfänger sind derart platziert, dass die Schallwellen des Strahlers von den Inhomogenitäten des zu untersuchenden Objekts reflektiert und anschließend vom Rezeptor registriert werden. Typische Anwendungen sind hierbei die Aufgaben seismischer Erkundung von Erdöl- und Erdgasfeldern sowie und der nicht destruktiven Ultraschalldiagnostik von Werkstoffen.
Weil dieses Modell keine Welleninterferenz beschreibt, ist die Anwendung unseres Verfahrens durch folgende Bedingung eingeschränkt: das zu untersuchende Objekt soll viel größere Abmessungen erweisen, als die charakteristische Wellenlänge der Bestrahlung (Programmpaket EMInverse).

Bei solchen Aufgaben liegt die Schwierigkeit in der korrekten Diskretisierung und Lösung des linearen Gleichungssystems mit einer dünnbesetzten Matrix. Diskretisierung wird von uns mit den Finite-Volumen- und Finite-Elemente-Verfahren derart durchgeführt, dass jedes Finite-Element den Durchlassgrad der Wellenstrahlung kennzeichnet, welcher mit strukturellen Eigenschaften des Mediums offenbar korreliert.

Wenn es keine vorläufigen Hypothesen über die Struktur des Objektes gibt, so kann man eine Reihe von adaptiven Verfeinerungen bzw. Vergrößerungen des Triangulationsnetzes zur Erhöhung der Stabilität und der Lösungsqualität durchführen. Dafür wird von uns die 3-dimensionale Triangulation nach Voronoi-Delone mit der stückweise linearen Approximation der physikalischen Parameter (Programmpaket EMLibGrid) angewendet. Dies führt zur Verbesserung der Genauigkeit der Berechnung und lässt die Anzahl der Unbekannten sowie die Dauer der Problemlösung verringern (Programmpakete EMLibIter und EMLibSparse).

Unser Unternehmen hat 17-jährige Erfahrung in der Entwicklung der Iterationsverfahren für die Lösung der Gleichungssysteme, was uns befähigt, die maximal passende und stabile Methode für die Behandlung des linearen Gleichungssystems zu finden und bei Notwendigkeit auch die singuläre Matrix korrekt zu regularisieren (Programmpaket EMLibIter).

II. Georadare und Erdölförderung


Wir helfen Ihnen, die räumliche Struktur eines 3-dimensionalen Objektes aufgrund des variierenden Interferenzbildes von der Schallwellenstreuung an den Inhomogenitäten des Objektes zu reproduzieren.

Durch die Lösung dieser Aufgabe kann man sowohl die Lagerung der Öl führenden Schichten auf Basis der seismischen Erkundung vorherbestimmen als auch die Korrektur von Ölbohrungen durchführen. Unsere Algorithmen wurden in den USA für die numerische Modellierung der Lagerung einer Öl führenden Schicht sowie des Richtbohrens erfolgreich angewendet. Strahler und Empfänger des elektromagnetischen Signals befanden sich unmittelbar auf dem Bohrer und erlaubten das Ende der Öl führenden Schicht bereits 5-7 Meter davor zu erkennen und die Einführung des Bohrers in taubes Gestein zu verhindern.
Zur Lösung dieser Aufgabe aufgrund der Maxwell-Gleichungen verwenden wir das Dualgitter-Verfahren und modellieren die Verbreitung der elektromagnetischen Wellen auf einem feinen, gut strukturierten Gitter, während die Werte der gesuchten elektrischen Durchlässigkeit auf dem adaptiven Tetraedergitter von Voronoi-Delone berechnet werden. Solche "Trennung" ermöglicht die maximal präzise Modellierung des magnetischen und elektrischen Feldes. Adaptiver Umbau des Gitters, auf dem die Dielektrlzitätskennzahl berechnet wird, lässt außerdem das Gleichungssystem mit keinen überflüssigen Variablen überlasten.

Unsere Algorithmen wurden bei Supercomputing Center in Maui (Hawaii, USA) im Auftrag von der Mobil-Gesellschaft zur Lösung der schlecht konditionierten, dünnbesetzten Gleichungssysteme betrachteter Art angewendet, mit spezieller Regularisierung und Einsatz der Massenparallelrechner (Modul A_SPARSE_T3D – Vorgänger unserer modernen Programmpakete EMParLibIter und EMParLibSparse).

Zur Zeit finden unsere Algorithmen (Programmpaket EMMaxwell) ihren Einsatz bei den 3-dimensionalen Georadar-Problemen.

Signal Processing

Unser Unternehmen entwickelt Spezialalgorithmen für die Verarbeitung von Daten, die von Fotoobjektiven mit der Superbandbreite herkommen und deshalb die Lichtspektren von Infrarot bis Ultraviolett enthalten. Unsere Algorithmen erlauben die 3D-Images des zu beobachtenden Objekts in Echtzeit zu generieren sowie die Information über Art der Werkstoffe auf der Objektoberfläche aufgrund der Spektralcharakteristiken zu erhalten.

Wenn es einige Lichtbilder desselben dreidimensionalen Objekts gibt, die man von verschiedenen Außenpunkten gemacht hat, so lässt sich ein neues Projektionsbild dieses Objekts von jedem anderen Punkt aus gewinnen, der von einem der ursprünglichen Basispunkte nicht weiter entfernt ist, als ein bestimmter effektiver Mittelabstand. Diese Methode erlaubt die Luft- und Weltraumaufnahme wesentlich zu vereinfachen: beim entfernten Vorbeifliegen an dem Objekt genügt es ihn nur in wenigen Zielkursen zu fotografieren. Danach kann man mittels unserer Algorithmen (Programmpaket EMLibMDD) die Ansicht des Objekts von irgendeiner anderen Richtung wiederherstellen.

Diese Algorithmen kann man auch für die Erkennung der Flugkörper durch ihre fragmentarischen Ablichtungen vom Land verwenden, indem man die erhaltenen Abbildungen mit den in einer Datenbank gespeicherten vergleicht. In diesem Fall braucht man nur wenige Ansichten der bekannten Flugkörper in die Datenbank einzutragen.

Wir bringen große Arbeitserfahrung mit verschiedenen Computerarchitekturen von Embedded Systems bis zu TOP 1 Superrechnern ein. Bei Notwendigkeit sind wir daher in der Lage, unsere Algorithmen auf Ihre On-Chip-Prozessoren zu übertragen oder Fertigwaren auf der Basis von On-Chip-Prozessoren unserer Partner anzubieten. Erfolgreiche Resultate in diesem Gebiet demonstriert das Programmpaket EMGPULibMDD.

Nanotechnology

Elegant Mathematics Ltd. entwickelt und führt erfolgreich die numerischen Algorithmen ein, welche man in der Biologie, Biochemie, Werkstoffkunde und in Nanotechnologien anwendet.

Unsere Lösungsschemata für physikalische Probleme auf Grundlage der Schrödingergleichung und ihrer Hartree-Fock Annäherungen sowie für die Probleme aus der Theorie der Elektronendichte von Grundstoffen werden für das industrielle Halbleiterdesign eingesetzt.

Derartige Algorithmen sind von uns für die genaue Berechnung der Elektronendichte und für die Vorhersage der Reaktionsfreudigkeit der Moleküle ausgearbeitet worden.

Während wir die Mikrowelt der Moleküle erforschen, streben wir nach der genaueren Beschreibung der Makrowelt. Indem wir z.B. die Energie eines Systems der zusammenwirkenden Moleküle über das Volumen integrieren, erhalten wir den Querschnittskern für die Boltzmann-Gleichung, auf deren Grundlage von uns die Aufgaben der Gasdynamik gelöst werden (Programmpaket EMBoltzmann).

Schon seit mehr als einem Jahrzehnt rekonstruieren wir auf der Basis der mehrdimensionalen Multivektorzerlegung reine Fluoreszenzspektren und relative Konzentrationen einzelner Grundstoffe anhand einer Reihe von den Fluoreszenzspektren verschiedener Gemische, deren Referenzspektren unbekannt sind. Ähnliches Verfahren kann in der hochleistungsfähigen Fluidchromatographie angewendet werden.

Unsere Algorithmen der mehrdimensionalen Multivektorzerlegung benutzt man für die Genauigkeitserhöhung bei der Eiweißanalyse aufgrund der kernmagnetischen Resonanz.

Wissenschaftliche Ausarbeitungen von Elegant Mathematics Ltd. zusammen mit Skandinavischem Nationalzentrum für die Kernresonanz Göteborg im Gebiet der Forschung der Eiweißmoleküle aufgrund der Kernresonanzspektroskopie sind weltweit einmalig und haben prinzipiell neuen Ergebnisse hervorgebracht, was die Anerkennung von Zeitschrift Nature gefunden hat.





EMLibIter

Programmpaket mit den Iterationsalgorithmen für die Lösung der linearen Gleichungssysteme sowie für die Ermittlung einer Gruppe von Eigenvektoren samt ihren Eigenwerten. Das Programmpaket implementiert die numerischen Verfahren CG, GMRES, GMRESF, NGMRES, BiCGStab für die linearen Gleichungssysteme sowie die Methoden von Lanczos, Arnoldi und Jacobi-Davidson für die Ermittlung eines einzigen Eigenvektors bzw. einiger Eigenvektoren der Matrix. Für jedes Iterationsverfahren besteht die Möglichkeit der Benutzung eines externen Vorkonditionierers und der Beschleunigung der Konvergenz durch ein Newton-Verfahren.

Free CUDA CG! Take advantage from our full featured 150GFlop/s
Conjugated Gradient CUDA and CPU solvers for float, double and quad precision for free.

Für Multicore, Vector-Pipeline, Out-of-Core, GPU und MPP optimiert; komplexe Arithmetik wird gesondert unterstützt.

Multicore – Mehrkernsysteme mit Prozessoren, die den gemeinsamen Arbeitsspeicher teilen, z.B. Xeon Quad Core
Vector-Pipeline – Prozessoren, die Vektor- und Pipeline-Befehle unterstützen, z.B. Prozessoren mit SSE2 Befehlssatzerweiterung
MPP – Mehrprozessorsysteme mit verteilter Arbeitsspeicher, z.B. Linux Clusters
GPU – Co-Prozessoren und Grafikkarten von Firmen NVIDIA und AMD-ATI
Out-of-Core – spezielle mathematische Algorithmen, sie beginnen den Speicherplatz auf der Festplatte auszunutzen, sobald der Arbeitsspeicher des Rechners erschöpft ist, wodurch keine signifikanten Produktivitätsverluste auftreten.

EMLibSparse

Programmpaket für die Lösung der dünnbesetzten linearen Gleichungssysteme sowie für die Ermittlung einer Gruppe von Eigenvektoren samt ihren Eigenwerten der dünnbesetzten Matrizen. Dieses Programmpaket enthält alle Iterationsalgorithmen von EMLibIter. Breite Wahl von Vorkonditionierern ermöglicht den Rechenaufwand zur Lösung des gestellten Problems wesentlich zu reduzieren. Als Vorkonditionierer benutzt man die inkompletten Cholesky- und LU-Zerlegung mit geschicktem Eliminierungskriterium für unbedeutende Elemente. Zur Optimierung des Rechen- und Speicheraufwandes kann man folgende Algorithmen mit einschalten: Bisektionsverfahren, Methoden der maximalen sowie approximativ-maximalen Potenz, des minimalen Schur-Komplements und der besten Permutation.

Free CUDA CG! Take advantage from our full featured 150GFlop/s
Conjugated Gradient CUDA and CPU solvers for float, double and quad precision for free.

Für Multicore, Vector-Pipeline, Out-of-Coreund teilweise für MPP optimiert; komplexe Arithmetik wird gesondert unterstützt.

Multicore – Mehrkernsysteme mit Prozessoren, die den gemeinsamen Arbeitsspeicher teilen, z.B. Xeon Quad Core
Vector-Pipeline – Prozessoren, die Vektor- und Pipeline-Befehle unterstützen, z.B. Prozessoren mit SSE2 Befehlssatzerweiterung
MPP – Mehrprozessorsysteme mit verteilter Arbeitsspeicher, z.B. Linux Clusters
GPU – Co-Prozessoren und Grafikkarten von Firmen NVIDIA und AMD-ATI
Out-of-Core – spezielle mathematische Algorithmen, sie beginnen den Speicherplatz auf der Festplatte auszunutzen, sobald der Arbeitsspeicher des Rechners erschöpft ist, wodurch keine signifikanten Produktivitätsverluste auftreten.

EMLibHMatrix

Programmpaket für die Lösung der vollbesetzten linearen Gleichungssysteme sowie für die Ermittlung einer Gruppe von Eigenvektoren samt ihren Eigenwerten. Dieses Programmpaket unterstützt alle Iterationsalgorithmen von EMLibIter mit vollständiger H-Matrix-Arithmetik. Dies ermöglicht die Zusammenstellung, Addition und Multiplikation von hierarchischen Matrizen sowie die Lösung entsprechender Gleichungssysteme, wobei endliche und iterative Verfahren mit Hierarchische-Basen-Vorkonditionierern angesetzt werden.

Free CUDA CG! Take advantage from our full featured 150GFlop/s
Conjugated Gradient CUDA and CPU solvers for float, double and quad precision for free.

Für Multicore, Vector-Pipeline, Out-of-Coreund teilweise für MPP optimiert; komplexe Arithmetik wird gesondert unterstützt.

Multicore – Mehrkernsysteme mit Prozessoren, die den gemeinsamen Arbeitsspeicher teilen, z.B. Xeon Quad Core
Vector-Pipeline – Prozessoren, die Vektor- und Pipeline-Befehle unterstützen, z.B. Prozessoren mit SSE2 Befehlssatzerweiterung
MPP – Mehrprozessorsysteme mit verteilter Arbeitsspeicher, z.B. Linux Clusters
GPU – Co-Prozessoren und Grafikkarten von Firmen NVIDIA und AMD-ATI
Out-of-Core – spezielle mathematische Algorithmen, sie beginnen den Speicherplatz auf der Festplatte auszunutzen, sobald der Arbeitsspeicher des Rechners erschöpft ist, wodurch keine signifikanten Produktivitätsverluste auftreten.

GPU Iterative Linear System Solvers

An average performance of CG, BiCGStab, Lanczos with real arithmetic equals to 7 GFlop/s on a single NVIDIA 260. This performance is achieved from 100,000 unknowns. A complex version of these iterative methods increases twice, 14 GFlop/s. It is almost 50 times faster than on the Quad-Core Xeon 2.6 GHz processor with 666 FSB, which can deliver only 100 MFlop/s.

The main reason of our achievements lies in the comprehensive usage of fast GPU memory.
Block versions of CG [1,2], BiCGStab, GMRES/FGMRES/NGMRES [3], Arnoldy and Davidson algorithms provide even faster performance. In particular zGMRES with 10 simultaneous right hand sides achieves 70 GFlop/s on NVIDIA 260; so it is almost the peak performance of double-precision arithmetic. The similar algorithm on the Quad Core Xeon 2.6 GHz processor with 666 FSB produces only 3 GFlop/s.

Our Kronecker Preconditioner and Kronecker sparse matrix multiplication algorithm [4,5] show the incredible 250 GFlop/s on one NVIDIA GPU 260!

Free CUDA CG! Take advantage from our full featured 150GFlop/s Conjugated Gradient CUDA and CPU solvers for float, double and quad precision for free:
EM-Free-CG.zip.
  • Nikishin A., Yeremin A. Variable block CG algorithms for solving large sparse symmetric positive definite linear systems on parallel computers. I. General iterative scheme. SIAM J. Matrix Anal. Appl. 16(4), 1995, 1135-1153.
  • Nikishin A., Yeremin A. An automatic scheme for regulating the block size in the block conjugate gradient method for solving linear systems. Zap. Nauchn. Sem. POMI, 2000, J. Math. Sci., 114(6), 2003, 1844-1853.
  • Kharchenko S., Yeremin A. Multiplicative correction of a matrix on a sequence of subspaces. I. Basic algorithms and theory for the general non symmetric sign-indefinite case. Zap. Nauchn. Sem. POMI, 2002, J. Math. Sci., 121(4), 2004, 2546-2575.
  • Ibraghimov I. Application of the three-way decomposition for matrix compression. Numer. Lin. Alg. Appl. 2002; 9:551-565.
  • Ibraghimov I., Sublinear Complexity of Krylov Subspace Method for the Kronecker Product Matrices. In press in Numer. Lin. Alg. Appl, 2009.

Fast GPU Multilinear NMR Deconvolution

The multilinear decomposition has been recently approved as a new robust method for data processing of multidimensional Nuclear Magnetic Resonance. These results were published in "Nature". The application problem has so huge sizes, that modern workstations need several days to find a solution.
A new high performance implementation of this algorithm for the GPU NVIDIA 2xx stream processors is presented.

The algorithm is based on sparse implementation of parallel factor decomposition algorithm (PARAFAC) that performs alternate sparsely defined least squares minimization.

The nuclear magnetic resonance (NMR) data are usually huge and have a large amount of data entries. To handle them one needs to solve several (often hundreds) almost nonoverlapping regions with a considerably small rank, and then to make a final tune of the total large rank system.

This package allows to compute large regions independently using all power of NVIDIA GPU.

This part often shows significant slow down in the CPU architecture since it requires solving a lot of small problems where CPU cannot show all power.

Since these parts are multithreaded over NVIDIA multiprocessors, it gives us high performance improvement. The only bottleneck in this part is load balancing, however, it is not very important with usage of large data sets. Hence, with data sets published in the articles below, we reached 50-60 times speedup.

The final solution of the joined multidimensional problem with a large rank (often about 1,000 components) was again efficiently implemented, and showed us improvement 30-40 times as much as before compared with Quad Core Xeon workstations.

The core solver of mddnmr distributed by Goteborg University was originally developed by Dr. Ibragimov in 2003 when he was on the University of Saarbruecken position. Right now this package is not supported. Please, consider our fully supported EMLibMDD package instead.
  • Jaravine V., Ibraghimov I., Orekhov V. Removal of a Time Barrier for High-Resolution Multidimensional NMR Spectroscopy. Nature Methods 3(8):605-607, 2006.
  • Jaravine V., Zhuravleva A., Permi P., Ibraghimov I., Orekhov V. Hyperdimensional NMR Spectroscopy with Nonlinear Sampling. JACS 130(12):3927-3936, 2008.

Consulting

Unsere Firma entwickelt die numerische Software für industrielle Aufgaben, deren Lösung uns zur Verwendung von unterschiedlichen Massenparallel- und Vektor-Pipeline-Computerarchitekturen sowie Out-of-Core-Ansätzen verleitet.

Mit jedem Auftraggeber gestalten wir zunächst gemeinsam seine Aufgabenstellung und bearbeiten diese dann maximal effektiv und schnell, indem wir zu einer optimalen Programmlösung verhelfen, die am schnellsten und am genausten auf der vorhandenen Computerplattform des Kunden funktionieren soll. Wenn Sie noch vor der Entscheidung stehen, auf welchem Rechner Sie unsere Algorithmen werden laufen lassen, so werden wir Ihnen helfen, diejenige Massenparallel-, Vektor-Pipeline- oder Out-of-Core-Architektur zu wählen, die Ihren Anforderungen und Möglichkeiten am besten entspricht.

Während der Benutzung unserer Programmprodukte bleiben wir stets in Ihrer Nähe, indem wir Sie unterstützen und beraten, damit die gestellten Aufgaben sicher gelöst werden können. Sie stoßen auf keine Probleme mit unserer Software, weil wir Ihnen beibringen, unsere Software zu benutzen, und Sie während derer Benutzung bedarfsgemäß beraten.

Wir suchen mit der boomenden Computerindustrie Schritt zu halten: zur Zeit sind viele unsere Algorithmen auf Plattformen mit Co-Prozessoren Tesla und 2xx von Firma NVIDIA übertragen worden; die Überarbeitung unserer Algorithmen für ATI-AMD-Prozessoren läuft ebenfalls auf vollen Touren. Die äußerst breite Arbeitserfahrung mit verschiedenen Vektor-Pipeline- und Massenparallel-Plattformen, welche seit Ende des vorigen Jahrhunderts existierten, erlaubt uns, die Algorithmen für Ihre konkreten Rechenressourcen zu entwickeln und zu optimieren.

Unsere Algorithmen lassen die Ausnutzung von Massenparallelrechnern zu. Wenn Sie über einen Rechner mit 1000 Prozessoren verfügen, so werden wir dann Ihre Aufgabe praktisch 1000-mal schneller berechnen.

Wenn Ihre Aufgabe soweit komplex ist, dass Ihre Rechenkapazitäten nicht mehr ausreichen, so wären wir bereit, Ihre Berechnungen auf unserem Supercomputer laufen zu lassen, oder wir hälfen Ihnen die Rechenzeit auf dem entsprechenden Supercomputer in führenden Rechenzentren der Welt zu beantragen.

Falls der Arbeitsspeicher für Ihre Aufgabe den Hauptengpass darstellt, so bieten wir unsere Out-of-Core-Lösungen, welche die Algorithmen kaum verlangsamen, jedoch ermöglichen, den Arbeitsspeicher bis zum Volumen der Festplatte auszuweiten.

Elegant Mathematics Ltd. hofft auf erfolgreiche Zusammenarbeit mit Ihnen!

Massively-Parallel and Multi-Core Consulting

Unsere Firma entwickelt die numerische Software für industrielle Aufgaben, deren Lösung uns zur Verwendung von unterschiedlichen Massenparallel- und Vektor-Pipeline-Computerarchitekturen sowie Out-of-Core-Ansätzen verleitet.

Mit jedem Auftraggeber gestalten wir zunächst gemeinsam seine Aufgabenstellung und bearbeiten diese dann maximal effektiv und schnell, indem wir zu einer optimalen Programmlösung verhelfen, die am schnellsten und am genausten auf der vorhandenen Computerplattform des Kunden funktionieren soll. Wenn Sie noch vor der Entscheidung stehen, auf welchem Rechner Sie unsere Algorithmen werden laufen lassen, so werden wir Ihnen helfen, diejenige Massenparallel-, Vektor-Pipeline- oder Out-of-Core-Architektur zu wählen, die Ihren Anforderungen und Möglichkeiten am besten entspricht.

Während der Benutzung unserer Programmprodukte bleiben wir stets in Ihrer Nähe, indem wir Sie unterstützen und beraten, damit die gestellten Aufgaben sicher gelöst werden können. Sie stoßen auf keine Probleme mit unserer Software, weil wir Ihnen beibringen, unsere Software zu benutzen, und Sie während derer Benutzung bedarfsgemäß beraten.

Wir suchen mit der boomenden Computerindustrie Schritt zu halten: zur Zeit sind viele unsere Algorithmen auf Plattformen mit Co-Prozessoren Tesla und 2xx von Firma NVIDIA übertragen worden; die Überarbeitung unserer Algorithmen für ATI-AMD-Prozessoren läuft ebenfalls auf vollen Touren. Die äußerst breite Arbeitserfahrung mit verschiedenen Vektor-Pipeline- und Massenparallel-Plattformen, welche seit Ende des vorigen Jahrhunderts existierten, erlaubt uns, die Algorithmen für Ihre konkreten Rechenressourcen zu entwickeln und zu optimieren.

Unsere Algorithmen lassen die Ausnutzung von Massenparallelrechnern zu. Wenn Sie über einen Rechner mit 1000 Prozessoren verfügen, so werden wir dann Ihre Aufgabe praktisch 1000-mal schneller berechnen.

Wenn Ihre Aufgabe soweit komplex ist, dass Ihre Rechenkapazitäten nicht mehr ausreichen, so wären wir bereit, Ihre Berechnungen auf unserem Supercomputer laufen zu lassen, oder wir hälfen Ihnen die Rechenzeit auf dem entsprechenden Supercomputer in führenden Rechenzentren der Welt zu beantragen.

Falls der Arbeitsspeicher für Ihre Aufgabe den Hauptengpass darstellt, so bieten wir unsere Out-of-Core-Lösungen, welche die Algorithmen kaum verlangsamen, jedoch ermöglichen, den Arbeitsspeicher bis zum Volumen der Festplatte auszuweiten.

Elegant Mathematics Ltd. hofft auf erfolgreiche Zusammenarbeit mit Ihnen!

Past Elegant Mathematics Activities

In Zeiten der Schnelligkeit – mit "superschnellen" Algorithmen!

In unserer Epoche der Hochtechnologien in vielen Branchen der Industrie entstehen globalen Probleme um die Fertigung von Produkten mit exakt vorgegebenen Parametern und Eigenschaften. Oft gilt es das zukünftige Objekt im Rahmen des eigenen Betriebes zu modellieren, um seine technischen Charakteristiken zu verbessern. Die Notwendigkeit der Modellierung wird akut, wenn die Objekte einen großen Aufwand der Energie und Menschenarbeit, d.h. erheblichen Geld- und Zeitaufwand erfordern, denn es ist oft unmöglich die Eigenschaften des Objektes vorherzusagen, bevor es das Produktionsfließband verlässt. In solchen Fällen wird der Industrie durch die Computermodellierung abgeholfen, wobei jede numerische Software für bestimmte industrielle Aufgabe entwickelt wird.

Mit der Entwicklung derartiger hocheffektiver Berechnungsprogramme beschäftigt sich die Mannschaft unserer Spezialisten. Der Kern unserer Softwareprodukte beruht auf den originellen "superschnellen" Matrixalgorithmen, welche keine vergleichbaren Äquivalente in der Welt finden und erlauben, die industriellen Aufgaben von der Spitzenkomplexität zu lösen.

Die langfristige Erfahrung in der Zusammenarbeit mit industriellen Auftraggebern verleitet uns, die letzten Erkenntnisse der Ingenieur- und Naturwissenschaft auszunutzen sowie die mehrjährige Programmiererfahrung mit verschiedenen Computerplattformen anzuwenden. Wir stellen den anspruchsvollsten Kunden zufrieden und kooperieren mit ihm auf Grundlage von gegenseitigem Verständnis und Anständigkeit.

Elena Ibragimova, Geschäftsführerin

Über uns

Firma Elegant Mathematics wurde im Jahr 1992 in den USA (Staat Washington) gegründet, sie produzierte und applizierte die Algorithmen zur Lösung der linearen Gleichungssysteme und Eigenwertprobleme für Vektor-, Pipeline- und Massenparallel-Superrechner im Zusammenhang mit mathematischen, physikalischen, hydro- und aerodynamischen, chemischen und vielen anderen Aufgaben, welche durch Verlangen der Industrie des vergangenen Jahrhunderts hervorgebracht wurden.

Spezialisten aus Elegant Mathematics arbeiteten mit der damals modernsten Rechentechnik von Cray Research Corporation: mit dem Vektor-Pipeline-Rechensystem Cray C90 (32 Prozessoren) und Massenparallel-Superrechner Cray T3D-T3E (1024 Prozessoren), installiert bei NASA, in Cray Research und in University of Pittsburgh; mit den massiv-parallelen Clustern IRIX, DEC ALPHA, RS6000, HP und Convex von Supercomputing Center of Hawaii sowie mit breitem Spektrum verschiedenartiger Linux-Cluster in der ganzen Welt.

Am Anfang des XXI. Jahrhunderts wurde die Firma weitgehend reformiert. Es fand gewisser Generationswechsel der Mitarbeiter statt; wir konnten uns auf die neuen Industrieaufgaben anpassen und den europäischen Markt betreten.

Seit 2006 ist die Tätigkeit von Elegant Mathematics nach Deutschland verlegt worden, worin sich unsere Zentralstelle zur Zeit befindet. Im Unternehmen werden hochqualifizierte Fachspezialisten beschäftigt: Mathematiker, Physiker, Chemiker, Programmierer. Sie besitzen internationale akademische Würden und veröffentlichen ihre Beiträge in den bekannten Fachzeitschriften: Nature, JACS, NLAA u.a.

Unsere Mitarbeiter wenden in ihrer Arbeit professionelle Kenntnisse an, welche den Großteil der aktuellen Aufgaben von Weltindustrie und Wissenschaft zu lösen ermöglichen. Durch die Verfolgung der neuen Technologien und industriellen Entwicklungsrichtungen sowie durch die geschickte Benutzung der bereits akkumulierten Kenntnisse in der Herstellung von Programmprodukten erzielen wir die Leistung des optimalen Beistandes in der Lösung der anspruchsvollsten Kundenaufgaben.



Here you can download booklets about our company

24 pages, in English, 4Mb
24 Blatt, auf Deutsch, 4Mb
24 pages, en Francaise, 4Mb

Quad Precision BLAS

A software package with complete
BLAS and ATLAS functionality that allow you to make basic linear algebra subroutine with quad precision.

You do not need a hardware support of quad precision, each quad precision value is implemented as sum of two doubles a+b, and a is bigger then b*eps, where eps is machine precision.

This package is allow you to construct iterative linear system solvers and other memory bounded algorithms with high precision and very few overhead in computational time. So, many modern x86 computers run our CG and other iterative linear system solvers based on this package only two times slower, that on double precision achieving 31 decimal precision digits on a solution!

This package is also useful for hardware with no support of double precision, like 8xx and 9xx series of NVIDIA GPU graphic cards, AMD streaming processors and IBM Cell, however, for specific hardware we are strictly recommend to ask us for corresponding version.
You may download:
  • qblas1.1-src.tar.gz sources for the most Linux and Windows (Cygwin) platform with development files and examples;
  • libqblas32.a precompiled 32 bit version of this library;
  • libqblas64.a precompiled 64 bit version of this library;
  • qblas.h C Header file;
  • qblas-demo.c C test example that runs CG on quad precision.

This is open source software copyrighted by Elegant Mathematics Ltd and distributed under GNU General Public License.

In case if you want to incorporate this library or its portions into your commercial projects, you can obtain this package or any other derivatives (for example, our iterative linear system solvers) with the commercial license that you can order from Elegant Mathematics Ltd.

Unsere Kontakte

Zentrale Geschäftsstelle

Elegant Mathematics Ltd.
Hanauer Mühle 2
66564 Ottweiler
Deutschland

Büro in England

Elegant Mathematics Ltd.
Omega 4 No. 116, 6 Roach Road
London E3 2PA
Großbritannien
Tel: +49 6821 207 11 74
Fax: +49 6821 920 63 93

Email: info.de@elegant-mathematics.com

Legal registration numbers:
Cardiff 05975337
HRB 16570
tax payer's account number 030/146/00565
EU VAT account number DE 257663693

Unsere Servicezentrale für die technische Information ist rund um die Uhr für Sie da! Sie können uns aus beliebigem Punkt der Welt kontaktieren und über unsere Produkte und Dienstleistungen jeweils in Englisch oder Deutsch aufgeklärt werden.

View Larger Map