Teilprojekt LS1: Spektralnäherungen von
Korrelationsfunktionen in der Gitter-Quantenchromodynamik mit
Rechnerbündeln
Folienpräsentation bei der Begehung durch die DFG 2002
Ausgangssituation
Das Teilprojekt LS1 soll als neues Projekt in die Abschlussphase
von RESH integriert werden. Es handelt sich dabei um ein
interdisziplinäres Forschungsvorhaben im Bereich Computational
Particle Physics/Elementarteilchenphysik und
Informatik/Clustercomputing, mit dem Ziel, einige numerisch besonders
schwierige Beobachtungsgrößen wie die
Η-Η' Massen zu berechnen, die sich auf die
topologische Struktur des Vakuums der Quantenchromodynamik beziehen.
Vorhandene Vakuum-Feldkonfigurationen sollen in diesem Projekt im
Hinblick auf die o.g. Massen umfassend analysiert werden. Diese
daten- und rechenintensiven Auswertungen sollen auf unserem 160 Gflops
Rechnerbündel ALiCE an der Universität Wuppertal im
Computerlabor für parallele Algorithmen und stochastische
Simulationen (COMPASS) durchgeführt werden. Essentiell für
die erfolgreiche Durchführung unseres Vorhaben wird der
Produktionseinsatz des parallelen Dateisystems "Clusterfile"
unter Myrinet/ParaStation3 sein.
Bei dieser groß-angelegten Analyse sollen neuartige spektrale
Näherungsverfahren für Quarkpropagatoren eingesetzt werden,
deren Effizienz wir bereits mit Erfolg exploriert haben.
Wir wollen mit dem neuen Projekt die existierende, sehr fruchtbare
komplementäre Zusammenarbeit (Zwillingsprojekt Ti264/7-1,
Li701/3-1) zwischen der Computational Particle Physics der
Universität Wuppertal einerseits und der Kerninformatik der
Universität Karlsruhe andererseits vertiefen. Während das
Zwillingsprojekt auf die technische Weiterentwicklung des
Clustercomputing unter Anwenderlast konzentriert ist, wird das hier
neu beantragte, physikorientierte Vorhaben jetzt im zweiten Schritt
ein erstes, extrem datenintensives Großprojekt auf ALiCE unter
ParaStation3 abbilden. Nach unseren bisherigen Erfahrungen werden die
hohen Anforderungen an Rechenleistung und insbesondere die komplexe
parallele Datenhaltung starke Rückkopplungen zu den anderen
Teilprojekten in RESH erzeugen.
Stand der Forschung
Das Physikalische Problem
Die Gittereichtheorie (GET) ist eine etablierte numerische Methode,
um die Quantenchromodynamik (QCD) (die fundamentale Theorie der
starken Wechselwirkung zwischen den Quarks) im Bereich der starken
Kopplung auszuwerten, wo die übliche Störungstheorie
versagt. Dies gilt z.B. für die Bestimmung der Eigenschaften von
Hadronen, d.h. Mesonen und Nukleonen. Dabei werden die Quantenfelder
der Quarks und der Gluonen auf einem endlichen diskreten
Raum-Zeit-Gitter mit Hilfe von parallelen Höchstleistungsrechnern
in Form eines statistischen Systems simuliert. Man charakterisiert
diese Simulationen mit dem Begriff ab-initio, da im Prinzip
keine weiteren Näherungen als die der Gitterapproximation
vorgenommen werden.
Es gibt in der QCD eine wichtige Klasse von
Beobachtungsgrößen, die unmittelbar Aufschluss über
die topologische Struktur des QCD Vakuums geben, aber bisher mangels
effizienter Messalgorithmen der GET praktisch nicht zugänglich
waren. Hierzu gehören insbesondere die pseudoskalaren Flavor
Singulett Mesonen Η und Η', deren Massen von
besonderem Interesse sind, da sie im herkömmlichen Szenario der
Elementarteilchentheorie in wesentlicher Weise durch die Brechung der
sog. U_A(1) Symmetrie der Theorie bestimmt sind, welche auf
die topologische Ladungsdichte im QCD Vakuum zurückgeht und sich
in der Nichterhaltung des Axialvektorstroms (selbst im chiralen Limes
der Theorie) äußert. Die beiden genannten Massen liegen
mit 547 und 957 MeV wesentlich über der Pionmasse von 135 MeV als
dem Goldstone Teilchen der QCD. Eine quantitative Berechnung dieses
Mass Gaps war bisher nicht modellfrei möglich. Sie stellt somit
eine große Herausforderung dar an die Methodik der GET. Die
große Masse des Η-Mesons sowie des
Η'-Mesons ist eine Folge der erwähnten
nicht-perturbativen Gluondynamik im Verein mit der sogenannten axialen
Anomalie.
Gitterrechnungen der Η-Η'-Massen
bestehen aus zwei Anteilen, dem sogenannten "connected
diagram" und dem "disconnected diagram". Während
der connected Anteil aus einem Standard-Quark-Propagator errechnet
werden kann, ist letzterer im wesentlichen die Korrelationsfunktion
zweier geschlossener Quarkpropagatoren. Das numerische Problem liegt
nun darin, dass die numerisch aussagekräftige Berechnung
geschlossener Quarkschleifen die Bestimmung des kompletten inversen
Propagators verlangt, ein aussichtsloses Unterfangen bei einem Rang
der fermionischen Massenmatrix, des Gitter-Dirac-Operators, von 10^6
bis 10^7. Bislang waren diese Größen nur über
stochastische Schätzverfahren zugänglich.
Diese stochastischen Methoden beruhen auf der Lösung eines
linearen Gleichungssystems der Fermionmatrix mit stochastischer
rechter Seite. Die eingesetzten Inversionsverfahren, wie BiCGStab mit
Präkonditionierung, sind extrem sensitiv auf die Konditionszahl
der fermionischen Matrix. Letztere wiederum hängt von der in der
Simulation vorgegebenen Quarkmasse ab. Daher wird diese Art der
Bestimmung der disconnected diagrams mit kleiner werdender Quarkmasse
dramatisch ineffizient.
Beispiele für den Einsatz stochastischer Schätzverfahren
finden sich in entsprechenden Arbeiten unseres SESAM/TΞL Projektes,
einer large-scale Simulation der vollen Quantenchromodynamik mit
dynamischen Fermionen, in welchem wir 10 Ensembles (bei verschiedenen
Kopplungen und Quarkmassen) von jeweils 200 Vakuum-Feldkonfigurationen
bei realistischen Gittergrößen auf Spezialrechnern erzeugt
haben.
Clustercomputing für Simulationen der Elementarteilchenphysik
Das Potenzial des Clustercomputing für Simulationen der
Gitter-QCD wurde seit Beginn der Beowulf-Aktivitäten diskutiert.
Mit dem Alpha-21264 Prozessor sowie der Gbit-Myrinet-Technologie
konnte in den letzten beiden Jahren gezeigt werden, dass
Rechnerbündel für die Gittersimulation den
möglicherweise kostengünstigsten Weg für die
Verwirklichung höchster Rechenleistungen darstellen.
- Im Dezember 1999 haben wir im "Institut für Angewandte
Informatik" (IAI) der Bergischen Universität Wuppertal die
Alpha-Linux-Cluster-Engine (ALiCE) installiert. Mittlerweile besteht
ALiCE aus 128 DS10 Workstations, mit Alpha 21264 EV6 616 MHz CPUs und
Myrinet Netzwerk, betrieben unter ParaStation3. Bei einer
Spitzenleistung von 160 Gflops erreichen QCD-Programme bis zu 30%
dieser Leistung, ein sehr ermutigender Wert im Vergleich zu
entsprechenden kommerziellen Maschinen.
- Die Gruppe um Z. Fodor an der Eötvös Universität,
Budapest, hat den sehr preisgünstigen "Poor Man's
Supercomputer" für Gitter-QCD-Rechnungen entwickelt. Viele
kleinere Projekte sind dieser Entwicklung bisher gefolgt.
- Das Jefferson-Lab (USA) zusammen mit der Gruppe von J. Negele vom
MIT planen die Konstruktion von Multi-Teraflopssystemen für QCD
bis 2004 auf der Basis von Rechnerbündeln. Erste Testsysteme
sind bereits am JLab installiert.
- M. Lüscher konnte auf der internationalen Gitterkonferenz
Lattice 2001 in Berlin demonstrieren, dass ein Intel Pentium 4 System
für Rechnungen der Gitter-QCD kostengünstiger zu sein
verspricht als entsprechende dediziert konstruierte Systeme wie
apeNEXT oder QCDOC.
Daraus wird klar, dass Rechnerbündel ein sehr hohes Potenzial
für die Grundlagenforschung aufweisen.
Eigene Vorarbeiten
Spektralmethoden
Im Zeitraum 1995 bis 2000 haben wir ein europaweites Projekt zur
Simulation der vollen QCD auf Rechnern der APE100-Klasse und Cray T3E
betrieben. Eine Zusammenfassung dieser Aktivitäten findet man in
der Habilitationsschrift von T. Lippert. Die erzeugten
Vakuum-Konfigurationen wurden am ZAM/FZ-Jülich archiviert und
wurden mittlerweile auch auf das von der DFG unter Li701/3-1
geförderte Datenarchiv am Rechnerbündel ALiCE transferiert.
Nachdem wir die wesentlichen Zweig-Regel-erhaltenden Prozesse mit
Hilfe dieser QCD Vakuum-Konfigurationen untersucht haben richtet sich
unser jetziges Programm auf die Bestimmung von
Flavor-Singulett-Größen.
In Ref. [Neff:2001ne] haben wir einen neuen Zugang zu diesen
Größen vorgestellt, der auf der Spektralnäherung von
Quarkpropagatoren in der vollen QCD basiert. In einer Serie von
Arbeiten wurde diese Methode verfeinert. Eine Zusammenfassung findet
man in der Dissertation von H. Neff.
Wir konnten nachweisen, dass man mit Quarkmassen im Arbeitsbereich
von SESAM mit weniger als 300 Eigenmoden eine hinreichende Genauigkeit
zur Darstellung des Η/Η'-Propagators
erreichen kann. Wir gehen aus von der hermitischen Darstellung des
Wilson-Dirac-Operators. Zur Berechnung der Eigenmoden verwenden wir
die parallele Version der Implicitly-restarted-Arnoldi-Methode mit
Chebyshev-Akzeleration. Wir erwarten, dass unser Verfahren infolge
der Dominanz kleiner Eigenwerte leistungsfähiger wird, wenn man
die Quarkmassen weiter verkleinert.
Wir konnten darüberhinaus eine wesentliche Verbesserung des
Massensignals von Η/Η' mit Hilfe einer
expliziten Grundzustandsprojektion erzielen. Damit wurde es erstmals
möglich, in der Zweipunktkorrelationsfunktion
C_Η'(t) ein Massenplateau ab t=1
nachzuweisen. Auf diese Weise konnten wir in unseren exploratorischen
Untersuchungen eine bisher unerreichte statistische Genauigkeit der
Massenbestimmung von 5% nachweisen, vor chiraler und
Kontinuumsextrapolation.
Clustercomputing
Das Rechnerbündel ALiCE, dessen Entwicklung im DFG-Projekt
Projekt Li701/3-1 gefördert wird, ist inzwischen eine
Referenzanlage der Firmen Compaq und ParTec. ALiCE zeigt im
Multi-Benutzerbetrieb in Forschung und Lehre hohe Stabilität und
Effizienz. Eine Zusammenfassung einiger wissenschaftlichen
Aktivitäten auf ALiCE findet man in Ref. [lippert:2001me].
Die in Li701/3-1 bewilligte Netzerweiterung zur Integration der
externen Datei- und Archiv-Dienstgeber sowie der schnellen
Visualisierungsanbindung unter Myrinet/ParaStation3 wurde erfolgreich
vorgenommen. Wir sind nun in der Lage, Daten (wie die archivierten
Vakuumfeldkonfigurationen und insbesondere die berechneten
Eigenfunktionen) zwischen dem parallelen Dateisystem auf ALiCE und dem
Archive-Server mit Gigabit-Performance zu übertragen.
In der Zwischenzeit haben wir im Rahmen des Projekts Li701/3-1
Modellmessungen der E/A-Leistung des parallelen Filesystems im
Vergleich zu expliziten MPI-Programmierungen unter
Myrinet/ParaStation3 vorgenommen, um die möglichen Datenraten vom
parallelen Plattensystem auf AliCE zu den Hauptspeichern der Knoten zu
bestimmen. Danach erwarten wir, dass die für die Auswertung der
Eigenmoden benötigten E/A-Datenraten unter ParaStation3 erreicht
werden können. Die im Projekt LS1 avisierte Anzahl von 300
Eigenmoden kann bei etwa 7 Gbyte Datenvolumen auf 32 Knoten in etwa 15
sec parallel gelesen und geschrieben werden. Da Eigenmoden bei
verschiedenen Quarkmassen zu kombinieren sind, werden in einem
Produktionslauf allerdings wiederholt E/A-Vorgänge
ausgeführt. Hier wird die Notwendigkeit der parallelen E/A
deutlich.
Es ist realistisch anzunehmen, dass das im Zwillingsprojekt
ausgebaute System ab Projektbeginn LS1 unter Produktionslast
genommen werden kann.
Querbezüge zu anderen Teilprojekten
Querbezüge des Teilprojektes LS1 zum Teilprojekt Ti1 sind
evident, da wir als Anwender auf die volle Effizienz der
Kommunikationssoftware angewiesen sind. Unsere informatisch
geschulten Mitarbeiter stehen permanent in engem Austausch mit der
Gruppe um Prof. Tichy. So werden wir in der Lage sein, etwaige
Schwächen des E/A Systems zu erkennen, um dieselben gemeinsam mit
den Kerninformatikern zu beheben.
Projektziele und Arbeitsprogramm
Das Ziel des Teilprojektes LS1 ist eine verlässliche
Berechnung der Masse von Flavor-Singulett-Mesonen.
Die in der explorativen Vorstudie erstellten drei Ensembles an
Eigenmoden sollen nun hinsichtlich der 5 noch fehlenden
Sea-Quark-Massen vervollständigt werden. Die vorhandenen
Sätze wurden soweit auf den Cray T3E-Systemen des
ZAM/FZ-Jülich und (in Kollaboration mit J. Negele, MIT) NERSC
(USA) erstellt.
Um die erforderliche partially-quenched Analyse unter Einschluss
von Strange-Valence-Quarks vornehmen zu können, soll weiterhin zu
jeder Sea-Quark-Masse auf bis zu drei verschiedenen
Valence-Quark-Massen gerechnet und analysiert werden. Dies ist die
Voraussetzung, das Mischungsproblem im
Η-Η'-System als Zweikanalrechnung
durchzuführen.
Weiterhin soll die Abhängigkeit der
&Eta-Η'- Masse vom Gitterabstand a
sowie das Verhalten unter Änderung des Gittervolumens ermittelt
werden. In diesem Zusammenhang ist eine enge Kopplung des Projektes
LS1 mit dem GRAL-Projekt geplant.
- [Phase I].
- Transfer der bereits vorhandenen Eigenmoden auf das ALiCE-Archive
(2.5 Tbytes)
- Tuning der parallelen-E/A-Leistung und abschließende
Programmerstellung
- Berechnung der Eigenmoden der noch fehlenden Sea-Quark-Ensembles
- [Phase II].
- Durchführung der vollen symmetrischen Analyse bei entarteten
Valence- und Sea-Quarks
- Explorative Berechnung des Zweikanalproblems
- [Phase III].
- Vollständige Berechnung der Eigenmoden
- Durchführung der vollständigen partially-quenched
Analyse
|