Konzepte der Statistischen Mechanik: Die Gleichwahrscheinlichkeit der Mikrozustände und die Definition der Boltzmann-Entropie

In den vorausgegangenen Kapiteln wurden die Abzählprobleme behandelt, die sich ergeben, wenn ein thermodynamisches System entweder auf der Ebene der Mikrozustände oder der Makrozustände beschrieben wird. Vergleicht man diese Ergebnisse mit den Gleichungen der phänomenologischen Thermodynamik, kann man eine statistische Definition der Entropie ableiten und damit eine (statistische) Erklärung des zweiten Hauptsatzes der Thermodynamik liefern. Die Boltzmann-Entropie wird mit Hilfe der Anzahl der Mikrozustände pro Makrozustand definiert und besitzt die Eigenschaften, die man innerhalb der Thermodynamik an die Entropie stellt.

Einordnung des Artikels

Die Diskussion der thermodynamischen Sichtweise auf den zweiten Hauptsatz der Thermodynamik und insbesondere die Beschreibung von Prozessen, die einen Temperaturausgleich beschreiben, findet sich in Anwendung des 2. Hauptsatzes der Thermodynamik: Temperaturausgleich.

Simulationen zu den hier vorgestellten Konzepten finden sich in:

Einführung

"Nach dem molekularkinetische Gesichtspunkt ist der zweite Hauptsatz der Thermodynamik lediglich ein Satz der Wahrscheinlichkeitsrechnung. Die Tatsache, dass wir niemals Ausnahmen beobachten, beweist nicht, dass der statistische Standpunkt falsch ist, da die Theorie voraussagt, dass die Wahrscheinlichkeit für eine Ausnahme, wenn die Molekülzahl groß ist, praktisch gleich null ist" (Ludwig Boltzmann, In: Ann. Phys. Leipzig 57 (1886) 773-784.)

Aus der Sicht der phänomenologischen Thermodynamik ist es schwer, eine mikroskopische Erklärung der Zustandsgröße Entropie abzuleiten. Die Lösung von Ludwig Boltzmann, die Zunahme der Entropie auf Wahrscheinlichkeitsaussagen zurückzuführen, ist daher höchst überraschend, aber im Nachhinein betrachtet besticht ihre Einfachheit. Im Folgenden werden die Annahmen erläutert (und ob wirklich alle Annahmen nötig sind), die diese mikroskopische Erklärung ausmachen:

  1. Alle Mikrozustände eines mechanischen Systems werden mit gleicher Wahrscheinlichkeit angenommen.
  2. Die mikroskopische Dynamik sorgt dafür, dass auf lange Sicht diese Gleichverteilung angenommen wird.
  3. Die Entropie S eines Systems, das sich in einem bestimmten Makrozustand befindet, wird mit der Wahrscheinlichkeit dieses Makrozustandes verknüpft; dies geschieht über die Formel P ∼ exp(S / kB). Gelingt es, die Wahrscheinlichkeit ohne Kenntnis der Entropie zu berechnen, kann man S mit Hilfe der Wahrscheinlichkeit P definieren.

Dabei ist kB eine Konstante, die allein schon aus Dimensionsgründen erforderlich ist. Und die rechte Seite von P ∼ exp(S / kB) muss mit einem geeigneten Normierungsfaktor versehen werden, so dass die Menge aller möglichen Mikrozustände die Wahrscheinlichkeit 1 erhält.

Warum die Exponentialfunktion verwendet wird und nicht einfach nur P ∼ S/kB ist sofort plausibel: Betrachtet man unabhängige Systeme, so addieren sich die Entropien, aber die Wahrscheinlichkeiten werden miteinander multipliziert, also

exp(S/kB) = exp((S1 + S2)/kB) = exp(S1/kB) · exp(S2/kB) ∼ P1 · P2.

Der Übergang eines Systems in das Gleichgewicht, das sich anfangs in einem Zustand weit entfernt vom thermodynamischen Gleichgewicht befindet, ist dann keine zwingende Notwendigkeit, sondern ein Vorgang, der mit hoher Wahrscheinlichkeit erfolgt, da ein Zustand mit höhere Entropie nach exp(S/kB) eine höhere Wahrscheinlichkeit besitzt. Umgekehrt ist es sehr unwahrscheinlich – aber nicht unmöglich –, dass ein System, das einmal den Zustand höchster Entropie erreicht hat, in einen Nichtgleichgewichtszustand übergeht. Wie noch zu zeigen ist, sind die Wahrscheinlichkeiten für Nichtgleichgewichtszustände allerdings verschwindend klein gegenüber dem thermodynamischen Gleichgewicht.

Die folgenden Überlegungen werden nicht allgemein, sondern immer bezogen auf das Modellsystem angestellt, das in Konzepte der Statistischen Mechanik: Mikrozustände und Makrozustände und Konzepte der Statistischen Mechanik: Die Abschätzung der Anzahl der Mikrozustände pro Makrozustand vorgestellt wurde; insbesondere die Begriffe Mikrozustand und Makrozustand werden so verwendet, wie sie dort eingeführt wurden. Ebenso werden die Ergebnisse der dort diskutierten Abzählprobleme und Abschätzungen (Stirling-Approximation) verwendet und nicht von Neuem hergeleitet.

Einführung eines Wahrscheinlichkeitsmaßes auf der Menge der Mikrozustände

Die Gleichwahrscheinlichkeit der Mikrozustände

In Konzepte der Statistischen Mechanik: Mikrozustände und Makrozustände wurden Mikrozustände und Makrozustände definiert und für ein spezielles Modellsystem die Abzählprobleme diskutiert, die sich durch ihre Einführung ergeben:

  1. Wie viele Mikrozustände gibt es?
  2. Wie viele Makrozustände gibt es?
  3. Wie viele Mikrozustände gibt es zu einem gegebenen Makrozustand?

Dabei ist jeweils vorgegeben, wie viele Teilchen N es gibt und welche Gesamtenergie E = K·E0 das System besitzt.

Bei diesen Diskussionen wurden nur Zustände abgezählt aber keine Wahrscheinlichkeiten berechnet; dazu müsste auf der Menge der Mikrozustände ein Wahrscheinlichkeitsmaß vorgegeben sein. Und genau dieses Wahrscheinlichkeitsmaß soll jetzt als grundlegendes Postulat der statistischen Mechanik eingeführt werden.

Postulat: Alle Mikrozustände treten mit identischen Wahrscheinlichkeiten auf.

In diesem und den folgenden Kapiteln wird dieses Postulat verwendet und nicht weiter hinterfragt. Irgendwann muss man natürlich die Frage stellen, welchen Status dieses Postulat hat, es sind zum Beispiel folgende Antworten möglich:

  1. Ähnlich wie in der phänomenologischen Thermodynamik muss man natürlich gewisse Voraussetzungen machen (dort sind es die Hauptsätze). Wenn das Postulat einigermaßen plausibel erscheint und sich die Hauptsätze damit tatsächlich erklären lassen, gibt es kaum einen Grund sie anzuzweifeln.
  2. Man sollte versuchen, das Postulat auf einfachere Tatsachen zurückzuführen. Es könnte zum Beispiel sein, dass die Bewegungsgesetze der Newtonschen Mechanik dazu führen, dass das postulierte Wahrscheinlichkeitsmaß sich immer einstellt, wenn man nur das System lange genug sich selbst überlässt.

Die zweite Antwort deutet schon darauf hin, dass die Frage nach der Berechtigung des Postulates schnell über den eigentlichen Gegenstand dieser Untersuchungen – die statistische Mechanik – hinausführt und hier nicht behandelt wird.

Das induzierte Wahrscheinlichkeitsmaß auf der Menge der Makrozustände

Da man bei jedem Mikrozustand eindeutig angeben kann, zu welchem Makrozustand er gehört, wird durch die Gleichverteilung auf der Menge der Mikrozustände ein Wahrscheinlichkeitsmaß auf der Menge der Makrozustände induziert: Die Wahrscheinlichkeit eines Makrozustandes ist proportional zur Anzahl der Mikrozustände, die ihn realisieren. Abbildung 1 versucht diese Wahrscheinlichkeitsmaße durch die Größen der Mengen darzustellen. Die Formeln der zugehörigen Abzählprobleme sind unten angegeben; sie wurden in Konzepte der Statistischen Mechanik: Mikrozustände und Makrozustände ausführlich diskutiert.

Abbildung 1: Ein Mikrozustand wird dadurch charakterisiert, dass für jedes Teilchen das Energieniveau angegeben wird. Durch die Einführung von Makrozuständen wird die Menge der Mikrozustände in Äquivalenzklassen eingeteilt: jeder Mikrozustand lässt sich eindeutig einem Makrozustand zuordnen. Ist auf der Menge der Mikrozustände ein Wahrscheinlichkeitsmaß gegeben, so wird auch auf der Menge der Makrozustände ein Wahrscheinlichkeitsmaß induziert. Nimmt man an, dass alle Mikrozustände gleich wahrscheinlich sind, kann man die Wahrscheinlichkeit eines Makrozustandes durch Abzählen bestimmen. Die Formeln zum Abzählen der Mikro- und Makrozustände sowie der Anzahl der Mikrozustände pro Makrozustand sind unten angegeben.Abbildung 1: Ein Mikrozustand wird dadurch charakterisiert, dass für jedes Teilchen das Energieniveau angegeben wird. Durch die Einführung von Makrozuständen wird die Menge der Mikrozustände in Äquivalenzklassen eingeteilt: jeder Mikrozustand lässt sich eindeutig einem Makrozustand zuordnen. Ist auf der Menge der Mikrozustände ein Wahrscheinlichkeitsmaß gegeben, so wird auch auf der Menge der Makrozustände ein Wahrscheinlichkeitsmaß induziert. Nimmt man an, dass alle Mikrozustände gleich wahrscheinlich sind, kann man die Wahrscheinlichkeit eines Makrozustandes durch Abzählen bestimmen. Die Formeln zum Abzählen der Mikro- und Makrozustände sowie der Anzahl der Mikrozustände pro Makrozustand sind unten angegeben.

Heuristische Überlegung: Die Definition der Entropie abgeleitet aus dem Vergleich von statistischer Mechanik und phänomenologischer Thermodynamik

Der Gang der Überlegung

In Konzepte der Statistischen Mechanik: Die Abschätzung der Anzahl der Mikrozustände pro Makrozustand wurde das Abzählproblem untersucht, welcher Makrozustand die größte Anzahl an Mikrozuständen besitzt. Die Lösung des Problems war dort nicht zufriedenstellend, da die hergeleiteten Gleichungen einen Lagrange-Multiplikator β enthalten, der zur Beschreibung des gesuchten Makrozustandes nötig ist, für den aber keine Interpretation gegeben wurde.

Diese Überlegungen sollen jetzt erneut durchgeführt werden, wobei aber die Perspektive gewechselt wird:

Letzteres bedeutet: Da hier ein spezielles Modellsystem behandelt wird, das eine einfache Beschreibung innerhalb der Thermodynamik erlaubt, muss man untersuchen, ob die Aussagen über das Abzählproblem in diese thermodynamischen Zusammenhänge übersetzt werden können.

Dabei ist die Thermodynamik für das Modellsystem in einer Gleichung zu beschreiben. Der erste Hauptsatz der Thermodynamik lautet eigentlich:

dU = TdS - pdV,

wodurch die innere Energie U, die Temperatur T, die Entropie S, der Druck p und das Volumen V verknüpft werden. Da das Modellsystem keinerlei Ausdehnung und Kräfte auf eine Begrenzung kennt, sondern lediglich aus unabhängigen Molekülen besteht, die bestimmte Energieniveaus annehmen können, vereinfacht sich der erste Hauptsatz hier zu:

dU = TdS.

Das heißt man muss einen Zusammenhang zwischen innerer Energie, Entropie und Temperatur herstellen.

Die Berechnung des wahrscheinlichsten Makrozustandes

Abbildung 2 zeigt die Voraussetzungen, unter denen der Makrozustand mit den meisten Mikrozuständen berechnet wird. Dies wurde ausführlich in Konzepte der Statistischen Mechanik: Die Abschätzung der Anzahl der Mikrozustände pro Makrozustand besprochen und hier nur kurz wiederholt:

  1. Die Anzahl der Mikrozustände pro Makrozustand ist durch den Multinomialkoeffizient (3) in Abbildung 2 gegeben.
  2. Der natürliche Logarithmus des Multinomialkoeffizienten wird in der vereinfachten Stirling-Approximation berechnet und definiert eine Funktion f, siehe Gleichung (4)).
  3. Die beiden Nebenbedingungen werden mit Hilfe der Funktionen g1 und g2 formuliert (siehe Gleichung (5) und (6)). Ihre Bedeutung: die Besetzungszahlen der Energieniveaus ni addieren sich zur gesamten Teilchenzahl N, siehe Gleichung (1); die Energien der Moleküle addieren sich zur Gesamtenergie E = K·E0, siehe Gleichung (2).

Abbildung 2: Voraussetzungen zur Formulierung des Extremwertproblems, bei dem ein Multinomialkoeffizient unter Nebenbedingungen maximiert werden soll.Abbildung 2: Voraussetzungen zur Formulierung des Extremwertproblems, bei dem ein Multinomialkoeffizient unter Nebenbedingungen maximiert werden soll.

Um das Maximum des Multinomialkoeffizienten aus Gleichung (3) unter den beiden Nebenbedingungen zu finden, wird die Funktion

f + α·g1 + β·g2

untersucht; sie enthält die beiden Lagrange-Multiplikatoren α und β. Man bildet die partiellen Ableitungen nach den Besetzungszahlen ni und setzt diese gleich null (siehe Gleichung (1) in Abbildung 3. Dadurch entstehen K+1 Gleichungen (siehe Gleichung (2) in Abbildung 3). Die Gleichungen können auch nach den Besetzungszahlen ni aufgelöst werden (siehe Gleichung (3) in Abbildung 3).

Abbildung 3: Der Makrozustand, bei dem der Multinomialkoeffizient maximal wird, kann durch die Besetzungszahlen in Gleichung (6) charakterisiert werden. Dazu wird die Zustandssumme (5) eingeführt. Sowohl die Besetzungszahlen der Energieniveaus als auch die Zustandssumme enthalten noch den Lagrange-Multiplikators β.Abbildung 3: Der Makrozustand, bei dem der Multinomialkoeffizient maximal wird, kann durch die Besetzungszahlen in Gleichung (6) charakterisiert werden. Dazu wird die Zustandssumme (5) eingeführt. Sowohl die Besetzungszahlen der Energieniveaus als auch die Zustandssumme enthalten noch den Lagrange-Multiplikators β.

Die Besetzungszahlen der Energieniveaus im wahrscheinlichsten Makrozustand

Mit Hilfe der sog Zustandssumme in Gleichung (5) in Abbildung 3 und durch Einsetzen der ersten Nebenbedingung lassen sich die Besetzungszahlen ni für den wahrscheinlichsten Makrozustand angeben: Gleichung (6) in Abbildung 3. Das Ergebnis ist einerseits noch wenig aussagekräftig, da der Lagrange-Multiplikator β noch unbekannt ist, andererseits lassen sich daraus schon wichtige Folgerungen ziehen, die auf den Zusammenhang zwischen Entropie, Energie und Temperatur hindeuten:

  1. Die linke Seite in Gleichung (6) kann man als denjenigen Anteil der Moleküle an der Gesamtzahl interpretieren, die das Energieniveau i einnehmen.
  2. Die rechte Seite der Gleichung kann noch nicht ausgewertet werden. Allerdings kann man schon ablesen, dass β eine positive Zahl sein muss. Denn sonst wären hohe Energieniveaus von vielen Molekülen besetzt. Dies ist aber ein Widerspruch dazu, dass mit Gleichung (6) der wahrscheinlichste Makrozustand charakterisiert wird. Dazu muss man nur den Grenzfall betrachten, wenn ein Molekül das höchste Energieniveau besetzt. Dann müssen sich alle anderen Moleküle im Grundzustand befinden – aber dafür gibt es genau eine Realisierungsmöglichkeit. Sehr viel mehr Realisierungen gibt es, wenn möglichst viele Moleküle niedrige Energieniveaus besetzen, da man den noch verbleibenden Energiebetrag auf viele Arten verteilen kann.
  3. Obwohl mit β auch der Normierungsfaktor Z(β) unbekannt ist, kann man schon etwas über die Verteilung der Besetzungszahlen aus Gleichung (6) ablesen: Setzt man q = exp(-β·E0), so liest ich die rechte Seite wie eine geometrische Verteilung, wobei das Verhältnis aufeinanderfolgender Wahrscheinlichkeiten gleich q ist; der Normierungsfaktor Z(β) ändert das Verhältnis nicht. Daraus lässt sich das qualitative Verhalten der Besetzungszahlen ablesen: Im Grenzfall q → 1 (dies entspricht β → 0) sind alle Besetzungszahlen gleich groß. Dagegen ist im Grenzfall q → 0 (entspricht β → ∞) nur der Grundzustand besetzt. Für Werte von q zwischen 0 und 1 erhält man Verteilungen der Besetzungszahlen, die mit zunehmendem i unterschiedlich schnell abnehmen: schnell für großes q, langsam für kleines q.

Diese Beobachtungen legen nahe, dass es einen Zusammenhang zwischen dem Lagrange-Multiplikator β und der Temperatur geben muss: Sehr hohe Temperaturen sorgen dafür, dass alle Energieniveaus etwa gleich besetzt sind, bei sehr tiefen Temperaturen sind nur die unteren Energieniveaus besetzt ("Einfrieren" des Systems). Dieser Zusammenhang lässt sich konkretisieren, wenn man die Besetzungszahlen ni aus Gleichung (3) in Abbildung 3 in die zweite Nebenbedingung einsetzt.

Die mittlere Energie beim wahrscheinlichsten Makrozustand

Zur Herleitung von Gleichung (6) in Abbildung 3 wurden die Besetzungszahlen ni aus (2) in die erste Nebenbedingung eingesetzt. Man kann sie auch in die zweite Nebenbedingung einsetzen; die entsprechende Rechnung ist in Abbildung 4 durchgeführt und führt zu Gleichung (2).

Abbildung 4: Herleitung einer Formel für die mittlere Energie pro Teilchen; die Gleichung ist nicht allgemeingültig, sondern gilt für den wahrscheinlichsten Makrozustand.Abbildung 4: Herleitung einer Formel für die mittlere Energie pro Teilchen; die Gleichung ist nicht allgemeingültig, sondern gilt für den wahrscheinlichsten Makrozustand.

Zur Interpretation von Gleichung (2) muss man bedenken, dass die Zustandssumme Z(β) nur von den Energieniveaus der Moleküle aber nicht von der Teilchenzahl N abhängt. Daher ist die rechte Seite unabhängig von N. Die Interpretation der linken Seite ist sofort klar: Hier wird zu gegebenem N und K die Gesamtenergie durch die Teilchenzahl geteilt, also die mittlere Energie pro Molekül berechnet.

Wenn man die rechte Seite mit Hilfe der Besetzungszahlen ni ausdrückt, steht auch rechts die mittlere Energie pro Molekül und durch Kürzen erhält man wieder die zweite Nebenbedingung – auf den ersten Blick hat man also nichts gewonnen.

Aber genau daran lässt sich die eigentliche Bedeutung von Gleichung (2) erkennen: Da K und N vorgegeben sind, ist die linke Seite für jeden Mikrozustand identisch. Wählt man einen beliebigen Mikrozustand zu diesen Werten von K und N und bestimmt die zugehörigen Besetzungszahlen ni, so ist nicht sichergestellt, dass die linke und die rechte Seite übereinstimmen. Gleichheit gilt aber mit Sicherheit, wenn der Makrozustand den Multinomialkoeffizienten maximiert. Und da aber diese Besetzungszahlen (also die für das Maximum des Multinomialkoeffizienten) durch Gleichung (6) in Abbildung 3 bereits gegeben sind, kann man Gleichung (2) in Abbildung 4 so lesen, dass sie den Wert von β festlegt: Unter allen möglichen geometrischen Verteilungen mit unterschiedlichen Werten von β, die Gleichung (6) in Abbildung 3 erfüllen, wird jetzt das β ausgewählt, das dafür sorgt, dass die beiden mittleren Energien übereinstimmen (also die links aus K und N berechnete und die rechts aus den Besetzungszahlen berechnete mittlere Energie).

Damit dieses Argument anwendbar ist, muss man lediglich zeigen, dass durch die Gleichung (2) der Wert von β eindeutig festgelegt ist; diese Überlegung wird in einem späteren Kapitel nachgereicht. Qualitativ kann man das Argument bereits beschreiben: Unterschiedliche Werte von β führen zu geometrischen Verteilungen mit q = exp(-β·E0), die wiederum unterschiedliche Erwartungswerte besitzen (in der Terminologie wie oben). Umgekehrt muss durch den gegebenen Erwartungswert der Faktor q eindeutig bestimmt sein.

Damit ist also der Wert von β eindeutig gegeben, wenn man annimmt, dass der wahrscheinlichste Makrozustand vorliegt. Jetzt kann man dazu übergehen, die Verbindung zu den thermodynamischen Größen Entropie und Temperatur herzustellen.

Die statistische Interpretation von Entropie und Temperatur

Das eigentliche Ziel ist es, eine statistische Interpretation des zweiten Hauptsatzes der Thermodynamik zu liefern. Dazu werden die bisherigen Überlegungen verwendet, um

In Abbildung 5 wird gezeigt, wie man den Näherungswert für den maximalen Multinomialkoeffizienten berechnet:

Hier sind auf der rechten Seite die Lagrange-Multiplikatoren α und β enthalten:

Abbildung 5: Abschätzung des Multinomialkoeffizienten für den wahrscheinlichsten Makrozustand.Abbildung 5: Abschätzung des Multinomialkoeffizienten für den wahrscheinlichsten Makrozustand.

Mit den bisherigen Überlegungen sind alle Informationen zusammengetragen, die man durch Nullsetzen der partiellen Ableitungen von f + α·g1 + β·g2 erhalten hat. Für die weiteren Überlegungen sollte man bedenken, dass Gleichung (2) in Abbildung 5 nicht allgemeingültig ist, sondern unter folgenden Voraussetzungen hergeleitet wurde:

  1. Die Teilchenzahl N und die Besetzungszahlen ni müssen so groß sein, dass man die vereinfachte Stirling-Approximation verwenden kann.
  2. Man hat verwendet, dass die Besetzungszahlen sowie die Lagrange-Multiplikatoren α und β den maximalen Multinomialkoeffizienten beschreiben.

Um einen Zusammenhang zur Entropie herzustellen, muss man eine weitere Annahme einführen: wie in der Einführung angedeutet, wird die Entropie mit der Anzahl der Mikrozustände pro Makrozustand in Verbindung gebracht. Da alle Mikrozustände gleich wahrscheinlich sind, ist diese Anzahl proportional zur Wahrscheinlichkeit für das Auftreten des entsprechenden Makrozustandes. Die statistische Entropie (oder Boltzmann-Entropie) wird jetzt über eine Wahrscheinlichkeit definiert (siehe auch Gleichung (3) in Abbildung 6):

SB = kB·ln(W).

Darin ist:

Abbildung 6: Die Definition der Boltzmann-Entropie in Gleichung (3). Ihr vollständiges Differential wird mit dem ersten Hauptsatz der Thermodynamik verglichen, wodurch sich ein Zusammenhang zwischen β und der Temperatur T ergibt.Abbildung 6: Die Definition der Boltzmann-Entropie in Gleichung (3). Ihr vollständiges Differential wird mit dem ersten Hauptsatz der Thermodynamik verglichen, wodurch sich ein Zusammenhang zwischen β und der Temperatur T ergibt.

Um einen Zusammenhang zwischen der Boltzmann-Entropie und der Entropie der phänomenologischen Thermodynamik herzustellen, wird in Gleichung (2) in Abbildung 5 der Lagrange-Multiplikator α eliminiert; dazu wird der Zusammenhang zwischen α und β verwendet, der schon in Abbildung 4 vorkam. Leitet man α nach β ab, erhält man die Ableitung der Zustandssumme nach β, die bereits in Abbildung 16 in Konzepte der Statistischen Mechanik: Die Abschätzung der Anzahl der Mikrozustände pro Makrozustand berechnet wurde.

Jetzt kann man das vollständige Differential der Boltzmann-Entropie bilden (siehe Gleichung (5) und (6) in Abbildung 6); es vereinfacht sich, wenn man den Zusammenhang zwischen α und β aus Gleichung (2) einsetzt. Vergleicht man (6) mit der Gleichung dS = dU / T der phänomenologischen Thermodynamik, so erkennt man: Das vollständige Differential der Boltzmann-Entropie SB stimmt mit dem von S überein, wenn

Es fehlt dann nur noch der Zahlenwert für die Boltzmann-Konstante kB, der aus diesen Überlegungen natürlich nicht abgeleitet werden kann. Aus anderen Überlegungen (etwa zum Strahlungsgesetz) kann man herleiten, dass kB mit der Avogadro-Konstante NA und der allgemeinen Gaskonstante R zusammenhängt:

NA = 6,022 · 1023 1/mol und R = 8,314 J/mol·K,

kB = R / NA = 1,380 · 10-23 J/K.

Die statistische Interpretation des zweiten Hauptsatzes der Thermodynamik

Die Boltzmann-Entropie

Wenn die statistische Mechanik eine Erklärung für den zweiten Hauptsatz der Thermodynamik liefern soll, wird man eine Reihe von Forderungen an die statistische Definition der Entropie SB stellen:

  1. In der phänomenologischen Thermodynamik ist die Entropie S eine Zustandsgröße; sie kann also einem System zugeordnet werden und lässt sich aus anderen makroskopischen Zustandsgrößen berechnen – zumindest wenn sich das System im thermodynamischen Gleichgewicht befindet. Man kann eine Zustandsgröße auch dadurch charakterisieren, dass bei einem Prozess ihre Veränderung nur vom Anfangs- und Endzustand abhängt, aber nicht davon, wie der Prozess geführt wird. (Um die Änderung einer Prozessgröße zu berechnen, muss man wissen, wie der Prozess geführt wird.) Dies muss auch für SB gelten.
  2. Durch die Zufuhr von Wärme kann Entropie von einem System auf das andere übertragen werden; diese Aussage ist der Inhalt der thermodynamischen Definition der Entropie dS = dQrev / T.
  3. Für Prozesse, die mit Hilfe der Thermodynamik beschrieben werden können, muss ΔS = ΔSB gelten.

Die erste Forderung wird man – vielleicht etwas vorschnell – als klar erfüllt ansehen. Denn die Boltzmann-Entropie ist für einen Makrozustand definiert, der eine Äquivalenzklasse von Mikrozuständen repräsentiert. Wird jetzt ein Prozess betrachtet, der auf verschiedene Arten realisiert werden kann, so hängt die Veränderung ΔSB nur von Anfangs- und Endzustand aber nicht von den Zwischenzuständen ab – die Boltzmann-Entropie ist also eine Zustandsgröße. Einwenden kann man dagegen, dass die Makrozustände, so wie sie hier definiert und verwendet wurden, nicht mit den Makrozuständen der phänomenologischen Thermodynamik übereinstimmen. Man sollte aber bedenken, dass das Modellsystem eingeführt wurde, um an einem möglichst einfachen System die Konzepte der statistischen Mechanik zu diskutieren. Eine "realistische" Beschreibung wird weitere Vergröberungen vornehmen, um zu den Makrozuständen der Thermodynamik zu gelangen – und dafür müsste man untersuchen, ob sich die Definition der Boltzmann-Entropie übertragen lässt und ob sie dann die Eigenschaften einer Zustandsgröße hat. Diese Diskussion kann hier nicht auf die Schnelle geführt werden.

Die zweite Forderung kann man am Modellsystem leicht nachvollziehen: Durch Zufuhr von Wärme steigt die Gesamtenergie E. Und wie bei den Abzählproblemen diskutiert wurde, gibt es dann mehr Mikro- und Makrozustände und die für die Entropie relevanten Multinomialkoeffizienten werden ebenso größer, da es mehr Möglichkeiten gibt die Gesamtenergie auf die Teilchen zu verteilen.

Und die dritte Forderung wurde ebenfalls für das Modellsystem gezeigt – genauer gesagt wurde diese Forderung verwendet, um die Größe zu identifizieren, die als mikroskopische Erklärung der Entropie S dienen kann (siehe Abbildung 6). Zusätzlich erkennt man an der Forderung ΔS = ΔSB, dass auch die statistische Mechanik nicht die Aufgabe hat, den absoluten Wert der Entropie festzulegen; es genügt die Veränderung der Entropie richtig zu beschreiben – in diesem Sinne ist die Definition SB = kB·ln(W) nicht eindeutig.

Die Zunahme der Entropie

In der Thermodynamik wird im zweiten Hauptsatz postuliert, dass die Entropie eines abgeschlossenen Systems nur zunehmen kann (oder im Grenzfall eines reversibel geführten Prozesses gleich bleiben kann). Die entscheidende Frage an die statistische Definition der Entropie ist natürlich, ob und wie dieses Postulat erklärt werden kann.

Die zentralen Aussagen, die im Folgenden erläutert und begründet werden, lauten (siehe auch das Zitat von Ludwig Boltzmann am Beginn der Einführung):

  1. Mit überwältigender Wahrscheinlichkeit geht ein System, das sich in einem Zustand befindet, der nicht einem thermodynamischen Gleichgewicht entspricht, in das thermodynamische Gleichgewicht über.
  2. Dieselbe Aussage gilt auch für die umgekehrte Sichtweise: ein Nichtgleichgewichtszustand ist mit überwältigender Wahrscheinlichkeit aus einem Gleichgewichtszustand hervorgegangen.
  3. Die Möglichkeit, dass ein Gleichgewichtszustand in einen Nichtgleichgewichtszustand übergeht, besteht prinzipiell, ist aber sehr unwahrscheinlich.

Der Gleichgewichtszustand ist dabei derjenige Makrozustand, der durch die meisten Mikrozustände realisiert wird – aufgrund der Gleichwahrscheinlichkeit der Mikrozustände also der wahrscheinlichste Makrozustand.

Abbildung 7 soll helfen diese Aussagen zu erläutern. Dazu ist links die Menge der Mikrozustände als Rechteck dargestellt. Die Definition der Makrozustände führt dazu, dass diese Menge in Äquivalenzklassen eingeteilt wird: jeder Mikrozustand kann einem Makrozustand zugeordnet werden. Diese Äquivalenzklassen können unterschiedliche Anzahlen von Mikrozuständen enthalten, was durch ihre unterschiedlichen Größen ausgedrückt werden soll.

Eine derartige Einteilung der Menge der Mikrozustände war schon in Abbildung 1 dargestellt, neu ist jetzt, dass die Anzahl der Mikrozustände einer Äquivalenzklasse verwendet wird, um die Boltzmann-Entropie zu definieren. Der Wert der Entropie soll durch die unterschiedlichen Farben angedeutet werden.

Abbildung 7: Das Rechteck steht jeweils für die Menge der Mikrozustände. Die Zick-Zack-Bewegung soll andeuten, dass in unregelmäßiger Folge verschiedene Mikrozustände angenommen werden. Durch die Einführung von Makrozuständen werden die Mikrozustände in Äquivalenzklassen eingeteilt. Links sind diese Äquivalenzklassen nahezu gleich groß und man erkennt, dass bei völlig unregelmäßiger Abfolge der Mikrozustände auf lange Sicht gilt: die Wahrscheinlichkeit, mit der ein bestimmter Makrozustand angenommen wird, ist proportional zur Anzahl der zugehörigen Mikrozustände. Rechts soll angedeutet werden, dass bei großen Teilchenzahlen die Wahrscheinlichkeiten der Makrozustände stark variieren; der Gleichgewichtszustand besitzt eine überwältigende Wahrscheinlichkeit gegenüber Zuständen, die weit vom Gleichgewicht entfernt sind.Abbildung 7: Das Rechteck steht jeweils für die Menge der Mikrozustände. Die Zick-Zack-Bewegung soll andeuten, dass in unregelmäßiger Folge verschiedene Mikrozustände angenommen werden. Durch die Einführung von Makrozuständen werden die Mikrozustände in Äquivalenzklassen eingeteilt. Links sind diese Äquivalenzklassen nahezu gleich groß und man erkennt, dass bei völlig unregelmäßiger Abfolge der Mikrozustände auf lange Sicht gilt: die Wahrscheinlichkeit, mit der ein bestimmter Makrozustand angenommen wird, ist proportional zur Anzahl der zugehörigen Mikrozustände. Rechts soll angedeutet werden, dass bei großen Teilchenzahlen die Wahrscheinlichkeiten der Makrozustände stark variieren; der Gleichgewichtszustand besitzt eine überwältigende Wahrscheinlichkeit gegenüber Zuständen, die weit vom Gleichgewicht entfernt sind.

Verfolgt man jetzt den zeitlichen Verlauf eines Systems, so erhält man – je nach Betrachtungsweise – eine Folge von Mikro- oder Makrozuständen. Dies soll durch die schwarzen Punkte ausgedrückt werden. Ist die Dynamik eher regellos, erhält man in der Menge der Mikrozustände eine Zick-Zack-Bewegung. Und man erkennt, dass auf lange Sicht die Wahrscheinlichkeit, mit der ein Makrozustand angenommen wird, zur Anzahl der Mikrozustände proportional ist ist, die den Makrozustand realisieren.

Zugleich erkennt man hier eine gewisse Schwäche der Argumentation: man kann an dieser Stelle nicht sagen, was genau unter einer "regellosen Dynamik" zu verstehen ist und welche Dynamik dazu führt, dass auf lange Sicht jeder Mikrozustand mit gleicher Wahrscheinlichkeit angenommen wird. (Anstelle einer "regellosen Dynamik" ist auch eine periodische Abfolge der Mikrozustände denkbar, bei der nicht alle möglichen Makrozustände erreicht werden.) Da diese Fragen nicht innerhalb der statistischen Mechanik gelöst werden können, sondern eine Analyse der Dynamik erfordern, hat man der statistischen Mechanik das Postulat der Gleichwahrscheinlichkeit aller Mikrozustände vorangestellt und es ist hier nicht der geeignete Ort, diese Fragen zu vertiefen.

Allerdings drückt die linke Abbildung die "Größenverhältnisse" der Äquivalenzklassen nicht richtig aus. Weiter unten wird ein Beispiel gezeigt, aus dem diese besser hervorgehen: Es gibt Makrozustände, die nur durch sehr wenige Mikrozustände realisiert werden und deren Zustandsgrößen weit von dem entfernt sind, was man als thermodynamisches Gleichgewicht bezeichnet. Und je mehr man sich dem thermodynamischen Gleichgewicht annähert, wachsen die Anzahlen der Mikrozustände pro Makrozustand, um im thermodynamischen Gleichgewicht das Maximum zu erreichen. Der rechte Teil von Abbildung 7 versucht die "Größenverhältnisse" auszudrücken: Hatten die Äquivalenzklassen links noch nahezu identische Größen, sind ihre Größen rechts deutlich unterschiedlich. Und bei einer regellosen Abfolge von Mikrozuständen werden die Zustände weit entfernt vom Gleichgewicht nur extrem selten angenommen, dagegen wird mit überwältigender Wahrscheinlichkeit der Makrozustand des thermodynamischen Gleichgewichts angenommen.

Aber Letzteres ist genau die statistische Erklärung der Entropiezunahme: sie ist hier kein strenges Gesetz, sondern eine Wahrscheinlichkeitsaussage. Und wie das Beispiel unten zeigen wird, werden die Unterschiede in den Anzahlen der Mikrozustände pro Makrozustand noch sehr viel größer als es Abbildung 7 ausdrücken kann.

Die statistische Erklärung besagt somit: Ein System, das sich nicht im thermodynamischen Gleichgewicht befindet, wird sich mit überwältigender Wahrscheinlichkeit zum Gleichgewicht hin entwickeln und nur mit sehr geringer Wahrscheinlichkeit im Nichtgleichgewichtszustand verbleiben oder sich sogar noch weiter vom Gleichgewicht entfernen. Und ist das thermodynamische Gleichgewicht erreicht, dann ist die Wahrscheinlichkeit wiederum sehr groß, dass das System im Gleichgewicht verharrt.

Beispiel: Die Aufteilung der Energie auf zwei identische Teilsysteme

Die Problemstellung

Mit dem folgenden einfachen Beispiel sollen die "Größenverhältnisse" innerhalb der Menge der Mikrozustände und die Boltzmann-Entropie illustriert werden. Dazu wird das Modellsystem mit N Teilchen in zwei Teilsysteme zerlegt, die beide N/2 Teilchen haben. Für das Gesamtsystem stehe der Energiebetrag K·E0 zur Verfügung (N und K werden als geradzahlig angenommen). Es gibt somit K+1 Möglichkeiten, wie die Energie auf die beiden Teilsysteme verteilt werden kann; dabei bezeichnet E1, 2 die Energie im ersten beziehungsweise zweiten Teilsystem, siehe auch Abbildung 8:

Es ist jetzt naheliegend zu fragen:

  1. Wie viele Mikrozustände gibt es zu einer gegebenen Aufteilung der Energie E1(K-i)·E0, E2 = i·E0, i = 0, 1, ..., K?
  2. Es ist klar, dass es für E1 = K·E0 / 2 = E2 die meisten Mikrozustände geben muss. Ist es gerechtfertigt davon zu sprechen, dass dieser Gleichgewichtszustand eine "überwältigende Wahrscheinlichkeit" besitzt?
  3. Wie ändern sich die "Größenverhältnisse" innerhalb der Menge der Mikrozustände, wenn die Teilchenzahl vergrößert wird?

Abbildung 8: Oben: Das Modellsystem hat N Teilchen und die Gesamtenergie E = K·E<sub>0</sub>. Mitte: Der Index i kann Werte von 0 bis K annehmen und mit ihm wird formuliert, wie die Gesamtenergie auf die Teilsysteme aufgeteilt wird. Unten: Aus Symmetriegründen müssen nicht alle Möglichkeiten behandelt werden, sonder nur K/2 + 1.Abbildung 8: Oben: Das Modellsystem hat N Teilchen und die Gesamtenergie E = K·E0. Mitte: Der Index i kann Werte von 0 bis K annehmen und mit ihm wird formuliert, wie die Gesamtenergie auf die Teilsysteme aufgeteilt wird. Unten: Aus Symmetriegründen müssen nicht alle Möglichkeiten behandelt werden, sonder nur K/2 + 1.

Abzählen der Mikrozustände

Da die Anzahl der Mikrozustände mit Hilfe von Binomialkoeffizienten berechnet werden kann, kann man die erste der oben gestellten Fragen für kleine N exakt beantworten. Die Funktion zur Berechnung der Anzahl der Mikrozustände zu gegebenem N und K wird wieder mit C(N, K) bezeichnet (siehe Abbildung 1 unten und Gleichung (1) in Abbildung 9).

Dazu werden N und K als gerade Zahlen angenommen und das System wird in zwei Teilsysteme gleicher Teilchenzahl aufgeteilt. Wenn ein Teilsystem i Energiequanten zugeteilt bekommt, hat das andere Teilsystem K - i Energiequanten. Die Anzahl der Mikrozustände der Teilsysteme lassen sich dann durch C(N/2, i) und C(N/2, K-i) berechnen.

Nimmt man an, dass die Teilsysteme unabhängig voneinander sind, besitzt das Gesamtsystem

C(N/2, i) · C(N/2, K-i), i = 0, 1, ..., K,

Mikrozustände. Dies ist gerade ein Summand in Gleichung (2) in Abbildung 9. Denn durch Summation über alle i = 0, 1, ..., K erhält man wieder C(N, K).

In Spezielle Abzählprobleme: Kombinationen mit Wiederholungen und die Beweismethode Stars and Bars (bei Abbildung 1) wurde gezeigt, dass man die Anzahl C(N, K) durch die Anzahl der Pfade im Gitter von (1, 0) nach (N, K) veranschaulichen kann, wobei man sich immer nur um einen Schritt nach rechts oder nach oben bewegen darf. Der erste Faktor C(N/2, i) aus obigem Produkt steht dann für die Pfade von (1, 0) nach (N/2, i) und der zweite Faktor für die Pfade von (N/2 + 1, i) nach (N, K). Man kann sich jetzt leicht überlegen, dass bei Summation über diese Produkte

Somit ergibt die Summe in Gleichung (2) tatsächlich C(N, K). In Abbildung 9 wird versucht, Gleichung (2) durch Pfade darzustellen: Die Aufteilung der Energie K in i und K-i entspricht allen Pfaden, die durch die Punkte auf der rechten Seite in Abbildung 9 laufen. Im Diagramm ist ein festes i gewählt und es wird jeweils ein Pfad eingezeichnet, der durch die vorgegebenen Punkte läuft.

Abbildung 9: Zum Abzählen der Mikrozustände wird das Problem in ein Abzählproblem für Pfade im Gitter übersetzt. Dass zwei Teilsysteme gebildet werden (jeweils mit Teilchenzahl N/2), entspricht der Vorgabe bestimmter Punkte (rechts), durch die die Pfade laufen müssen.Abbildung 9: Zum Abzählen der Mikrozustände wird das Problem in ein Abzählproblem für Pfade im Gitter übersetzt. Dass zwei Teilsysteme gebildet werden (jeweils mit Teilchenzahl N/2), entspricht der Vorgabe bestimmter Punkte (rechts), durch die die Pfade laufen müssen.

Auswertung für unterschiedliche Teilchenzahlen

Die folgenden Abbildungen zeigen die Anzahlen von Mikrozuständen (oder Pfaden) für spezielle Werte von N und K:

  1. In Abbildung 10 ist N = 64 und K = 64 gewählt. Als Histogramm dargestellt sind die K+1 Summanden aus Gleichung (2) in Abbildung 9. Man erkennt, dass es die meisten Mikrozustände gibt, wenn die Energie gleich zwischen den Teilsystemen aufgeteilt wird (i = K/2 = 32).
  2. In Abbildung 11 ist das Histogramm mit logarithmischer y-Achse dargestellt. Zusätzlich sind die beiden Faktoren aus C(N/2, i) · C(N/2, K-i) dargestellt (grün der erste Faktor, orange der zweite Faktor). Bei einer linear skalierten y-Achse sind die Faktoren so klein, dass man sie nicht zusammen mit dem Produkt darstellen kann.
  3. Abbildung 12 zeigt nur diese beiden Faktoren in linearer Skalierung der y-Achse.
  4. Abbildung 13 entspricht Abbildung 10 jetzt aber mit N = 128 und K = 128.
  5. Abbildung 14 entspricht Abbildung 11 wieder mit N = 128 und K = 128.
  6. Und Abbildung 15 entspricht Abbildung 12 wieder mit N = 128 und K = 128.

Abbildung 10: Die Aufteilung der Gesamtenergie auf die beiden Teilsysteme wird durch die Variable i, i=0, 1, ..., K festgelegt. Im Diagramm ist die Anzahl der Mikrozustände zu gegebenem i dargestellt, wobei N=64 und K=64.Abbildung 10: Die Aufteilung der Gesamtenergie auf die beiden Teilsysteme wird durch die Variable i, i = 0, 1, ..., K festgelegt. Im Diagramm ist die Anzahl der Mikrozustände zu gegebenem i dargestellt, wobei N = 64 und K = 64.

Abbildung 11: Darstellung wie in Abbildung 10, aber mit logarithmischer Skalierung der y-Achse. (Wieder N=64 und K=64). Zusätzlich eingetragen sind die beiden Faktoren, aus denen sich die Anzahl der Mikrozustände berechnet.Abbildung 11: Darstellung wie in Abbildung 10, aber mit logarithmischer Skalierung der y-Achse. (Wieder N = 64 und K = 64). Zusätzlich eingetragen sind die beiden Faktoren, aus denen sich die Anzahl der Mikrozustände berechnet.

Abbildung 12: Darstellung der beiden Faktoren aus Abbildung 11, jetzt aber mit linear skalierter y-Achse. (Wieder N=64 und K=64).Abbildung 12: Darstellung der beiden Faktoren aus Abbildung 11, jetzt aber mit linear skalierter y-Achse. (Wieder N = 64 und K = 64).

Abbildung 13: Darstellung wie Abbildung 10, aber mit N=128 und K=128.Abbildung 13: Darstellung wie Abbildung 10, aber mit N = 128 und K = 128.

Abbildung 14: Darstellung wie Abbildung 11, aber mit N=128 und K=128.Abbildung 14: Darstellung wie Abbildung 11, aber mit N = 128 und K = 128.

Abbildung 15: Darstellung wie in Abbildung 12, aber mit N=128 und K=128.Abbildung 15: Darstellung wie in Abbildung 12, aber mit N = 128 und K = 128.

Man erkennt an den Abbildungen:

  1. Die Anzahlen C(N/2, i), i = 0, 1, ..., K, wachsen mit steigendem i (grün in Abbildung 11, 12, 14 und 15). Das ist leicht verständlich, da es bei mehr zur Verfügung stehenden Energiequanten mehr Möglichkeiten gibt, sie unter den Molekülen aufzuteilen und es somit mehr Mikrozustände gibt.
  2. Da im Produkt C(N/2, i) · C(N/2, K-i) ein Faktor monoton zunimmt und der andere entsprechend monoton abnimmt, erhält man die größte Anzahl an Mikrozuständen im Fall i = K/2. Im Verhältnis dazu gibt es nur sehr wenige Mikrozustände, wenn die Energien sehr ungleich zwischen den Teilsystemen aufgeteilt werden.
  3. Dies gilt für jedes N. Vergleicht man aber die Abbildungen zu unterschiedlichen N, so wird deutlich, dass bei größerem N die Verteilung "schärfer" wird. Damit ist gemeint, dass das Energieintervall, in dem der Großteil der Mikrozustände enthalten ist, bezogen auf das gesamte Energieintervall immer kleiner wird.

Um den letzten Punkt zu verdeutlichen, werden die Abbildungen 10 und 13 nebeneinander gestellt, aber mit identischer Skalierung der Achsen, siehe Abbildung 16. Dabei ist die y-Achse wieder logarithmisch skaliert, da sonst die Verteilung für N = 64 nicht zu erkennen ist.

Abbildung 16: Darstellung von Abbildung 10 und 13 mit identischer Skalierung der Achsen. Jetzt ist deutlich zu erkennen, wie bei der Zunahme der Teilchenzahl die Verteilung schärfer um den Mittelwert konzentriert ist.Abbildung 16: Darstellung von Abbildung 10 und 13 mit identischer Skalierung der Achsen. Jetzt ist deutlich zu erkennen, wie bei der Zunahme der Teilchenzahl die Verteilung schärfer um den Mittelwert konzentriert ist.

In der Beschreibung der statistischen Interpretation des zweiten Hauptsatzes wurde immer wieder davon gesprochen, dass der Gleichgewichtszustand eine "überwältigende Wahrscheinlichkeit" gegenüber Nichtgleichgewichtszuständen besitzt. Die bisher gezeigten Abbildungen drücken dies noch nicht überzeugend aus. Dazu sind aber zwei Gegenargumente anzuführen:

  1. Da die Anzahl der Mikrozustände über Binomialkoeffizienten berechnet wird und hier noch keine Näherungen verwendet wurden, kann man die oben gezeigten Verteilungen nicht für sehr große Teilchenzahlen N berechnen. Mit N = 128 ist man natürlich noch weit von thermodynamischen Größenordnungen entfernt, alsoo N ≈ 1025.
  2. Wenn (wie etwa in Abbildung 16) die Variable i um 1 erhöht wird, entspricht dies gerade einem Energieaustausch von E0 zwischen den Teilsystemen. Und da die Energieniveaus der Moleküle den Abstand E0 besitzen, ist dies eine mikroskopische Veränderung. Um tatsächlich Makrozustände zu beschreiben, wird man zu mehreren i-Werten die Mikrozustände zu einem Makrozustand zusammenfassen (Vergröberung). In Abbildung 17 geschieht dies, indem jeweils 3 Balken des linken Histogramms (das Abbildung 13 in anderer Skalierung zeigt) zu einem Balken zusammengefasst werden. Rechts ist dann die vergröberte Verteilung zu sehen; um beide besser miteinander vergleichen zu können, werden beide Diagramme identisch skaliert. Man kann jetzt deutlich erkennen, wie die Vergröberung der Variablen zu einer schärferen Verteilung führt.

Abbildung 17: Links: Darstellung wie in Abbildung 13, also mit N=128 und K=128. Rechts: Anzahlen der Mikrozustände bei einer vergröberten Betrachtung der Makrozustände (genauere Erklärung im Text).Abbildung 17: Links: Darstellung wie in Abbildung 13, also mit N = 128 und K = 128. Rechts: Anzahlen der Mikrozustände bei einer vergröberten Betrachtung der Makrozustände (genauere Erklärung im Text).