自由エネルギー原理の勉強 (original) (raw)

N個の粒子からなる、体積V理想気体を考えます。この理想気体は孤立していて、外部とのエネルギーのやり取りはないものとします。すると、この理想気体の全エネルギーEは一定になります。また、この理想気体を構成する粒子1個の質量をmとします。そうすると全エネルギーEは次のように表すことが出来ます。

E=\displaystyle\sum_{i=1}^{3N}\frac{p_i^2}{2m} (12-1)

ここでp_iはΓ空間における運動量の成分です。n番目の粒子の運動量のx成分はp_{3(n-1)+1}y成分はp_{3(n-1)+2}z成分はp_{3n}で表されます。式(12-1)を変形すると、

\sum_{i=1}^{3N}p_i^2=2mE (12-2)

となります。これはp_iを座標とする3N次元空間における半径\sqrt{2mE}の球の表面を表しているということになります。

n次元の球の表面積の求め方

以下にn次元の球の表面積を求める方法を説明します。

n次元の球の体積V_nは、その半径をrとすると

V_n=c_nr^n (12-3)

の形で書くことが出来ます。ただし、c_nnの値のみによって決まる値です。n次元の球の表面積S_nは、V_nrによる微分で求めることが出来ます。よって

S_n=\displaystyle\frac{dV_n(r)}{dr}

よって

S_n=nc_nr^{n-1} (12-4)

となります。

ここで(天下り的ですが)

\displaystyle{I_n}=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}\cdots\int_{-\infty}^{\infty}e^{-(x_1^2+x_2^2+\cdots+x_n^2)}dx_1dx_2{\cdots}dx_n (12-5)

について考えます。この積分極座標で考えた場合、

r^2=x_1^2+x_2^2+\cdots+x_n^2

で半径rが決まり、S_ndr積分すればよいことが分かります。よって式(12-5)は

\displaystyle{I_n}=\int_0^{\infty}e^{-r^2}S_ndr=\int_0^{\infty}e^{-r^2}nc_nr^{n-1}dr

よって

\displaystyle{I_n}=nc_n\int_0^{\infty}e^{-r^2}r^{n-1}dr (12-6)

となります。ここでt=r^2という変数変換を行うと、dt=2rdrなので

\displaystyle{I_n}=nc_n\int_0^{\infty}e^{-t}r^{n-2}\frac{1}{2}dt

よって

\displaystyle{I_n}=\frac{n}{2}c_n\int_0^{\infty}e^{-t}t^{\frac{n}{2}-1}dt (12-7)

ここで、以下の式で定義されるガンマ関数\Gamma(x)

\displaystyle\Gamma(x)\equiv\int_0^{\infty}e^{-t}t^{x-1}dt (12-8)

を用いると、式(12-7)は

I_n=\displaystyle\frac{n}{2}c_n\Gamma\left(\frac{n}{2}\right) (12-9)

と書くことが出来ます。

一方、式(12-5)は以下のようにも変形できます。

\displaystyle{I_n}=\left[\int_{-\infty}^{\infty}e^{-x^2}dx\right]^n

\displaystyle{I_n}=\left[2\int_0^{\infty}e^{-x^2}dx\right]^n (12-10)

ここで、

J=\displaystyle\int_0^{\infty}e^{-x^2}dx

と置くと、

J^2=\displaystyle\left(\int_0^{\infty}e^{-x^2}dx\right)\left(\int_0^{\infty}e^{-y^2}dy\right)

=\displaystyle\int_0^{\infty}\int_0^{\infty}e^{-(x^2+y^2)}dxdy

=\displaystyle\int_0^{\frac{\pi}{2}}\int_0^{\infty}e^{-r^2}drrd\theta=\frac{\pi}{2}\int_0^{\infty}re^{-r^2}dr

=\displaystyle\frac{\pi}{2}\left[-\frac{1}{2}e^{-r^2}\right]_0^{\infty}=\frac{\pi}{2}\cdot\frac{1}{2}

=\displaystyle\frac{\pi}{4}

よって

J=\displaystyle\int_0^{\infty}e^{-x^2}dx=\frac{\sqrt{\pi}}{2} (12-11)

これを式(12-10)に代入すると

{I_n}=\displaystyle\left(\sqrt{\pi}\right)^n=\pi^{\frac{n}{2}} (12-12)

式(12-12)と式(12-9)から

\displaystyle\frac{n}{2}c_n\Gamma\left(\frac{n}{2}\right)=\pi^{\frac{n}{2}}

よって

c_n=\displaystyle\frac{\pi^{\frac{n}{2}}}{\frac{n}{2}\Gamma\left(\frac{n}{2}\right)} (12-13)

となります。

ところで、式(12-13)の\displaystyle\frac{n}{2}\Gamma\left(\frac{n}{2}\right)の部分は、\displaystyle\Gamma\left(\frac{n}{2}+1\right)と置き換えることが出来ます。その理由は以下の通りです。

ガンマ関数の定義

\displaystyle\Gamma(x)\equiv\int_0^{\infty}e^{-t}t^{x-1}dt (12-8)

の右辺を部分積分すると

\Gamma(x)=[-e^{-t}t^{x-1}]_0^{\infty}-\int_0^{\infty}(-e^{-t})(x-1)t^{x-2}dt=0+(x-1)\int_0^{\infty}e^{-t}t^{x-2}dt

=(x-1)\Gamma(x-1)

つまり

\Gamma(x)=(x-1)\Gamma(x-1)

となります。ここで、

\displaystyle{x}=\frac{n}{2}+1

とおくと

\Gamma\left(\frac{n}{2}+1\right)=\frac{n}{2}\Gamma\left(\frac{n}{2}\right)

となります。よって、式(12-13)は

c_n=\displaystyle\frac{\pi^{\frac{n}{2}}}{\Gamma\left(\frac{n}{2}+1\right)} (12-14)

となります。この式と式(12-4)から、n次元の球の表面積S_nは、以下のようになります。

S_n=\displaystyle\frac{\pi^{\frac{n}{2}}}{\Gamma\left(\frac{n}{2}+1\right)}nr^{n-1} (12-15)

以上でn次元の球の表面積の求め方の説明を終わります。

理想気体の微視的状態の数を計算する前に、理想気体の圧力、体積、温度とエネルギーの関係を求めておきます。

まず、理想気体の状態方程式

pV=nRT (8-13)

から始めます。ここにp理想気体の圧力、Vは体積、nはモル数、R気体定数Tは温度です。モル数というのは粒子の数を表す量で、1モルがアボガドロ数N_Aで、その値は約6.02\times10^{23}個でした。よって理想気体の粒子の数N

N=nN_A (11-1)

と書けます。これを使って式(8-13)を変形すると、

pV=N\displaystyle\frac{R}{N_A}T (11-2)

となります。ここで気体定数Rアボガドロ数N_Aも定数なので、R/N_Aも定数になります。実はこれが統計力学の基礎になるボルツマン定数kです。

k=\displaystyle\frac{R}{N_A} (11-3)

この式を用いると式(11-2)は以下の形に変形されます。

pV=NkT (11-4)

今度は理想気体の粒子の運動によって圧力の発生を説明してみましょう。理想気体x軸に垂直な2つの平面とy軸に垂直な2つの平面とz軸に垂直な2つの平面からなる直方体の容器の中に入っているとします。x軸に垂直な平面で、x座標の大きいほうが容器の外、小さいほうが容器の中になっている平面を取り上げ、この平面にかかる圧力を考えます。

この平面の微小な面積dSを考えます。短い時間dtの間にぶつかる粒子の数を考えます。粒子の速度のx成分をv_xとします。v_x>0の粒子しかこの平面にぶつかりません。速度のx成分v_xを持ち、dtの間に面積dSにぶつかる粒子は体積dV=v_xdtdSの中にいると考えることが出来ます。

全体でN個の粒子があります。その中で速度のx成分がv_xv_x+dv_xの間にある粒子の数をf(v_x)dv_xNで表すことにします。f(v_x)の関数の形はあとで考察します。

dVの中にある粒子の数は、あらゆる速度の粒子がどこにも均等に存在すると考えられるので、

N\displaystyle\frac{dV}{V}

個であると考えられます。さらに、dVの中にいる、速度のx成分がv_xv_x+dv_xの間にある粒子の個数は

f(v_x)dv_xN\displaystyle\frac{dV}{V}

個になります。dV=v_xdtdSだったので、これは以下のように書き換えることが出来ます。

f(v_x)dv_xN{\displaystyle}\frac{v_x}{V}dtdS (11-5)

1回の衝突での粒子の運動量の変化は2mv_xです。それが面積dSに時間dtの間に式(11-5)の個数だけ衝突するわけです。単位時間あたりの運動量の変化が力になりますので、面積dSにかかる力F

F=\displaystyle\int_0^{\infty}2mv_xf(v_x)v_x\frac{N}{V}dSdv_x (11-6)

になります。定積分の下端が0なのは、v_x>0の粒子しか壁にぶつからないからです。単位面積当たりの力が圧力pなので、p

p=\displaystyle\int_0^{\infty}2mv_xf(v_x)v_x\frac{N}{V}dv_x

v_xに依存しない変数を積分の外に出して

p=2m\displaystyle\frac{N}{V}\int_0^{\infty}v_x^2f(v_x)dv_x (11-7)

となります。この先を計算するためにはf(v_x)の形を決めなければなりません。ここで、粒子の速度の分布は速度ベクトルの絶対値vのみに依存し、速度ベクトルの方向には依存しないと仮定します。粒子がランダムに運動すると考えれば、この仮定は妥当でしょう。すると、分布の形に関わらず、この仮定を満たしてさえいれば、

p=\displaystyle{m}\overline{v^2}\frac{N}{3V} (11-8)

となることを示すことが出来ます。ここで\overline{v^2}v^2の平均値を表します。式(11-8)の導出過程は別途示します。

ここから

\displaystyle{p}V=\frac{m\overline{v^2}N}{3} (11-9)

この式と式(11-4)から

\displaystyle\frac{m\overline{v^2}N}{3}=NkT

となり

T=\displaystyle\frac{m\overline{v^2}}{3k} (11-10)

となります。ところで粒子1個のエネルギーは運動エネルギーだけです。粒子1個の運動エネルギーの平均値E_{ind}

E_{ind}=\displaystyle\overline{\frac{1}{2}mv^2}=\frac{1}{2}m\overline{v^2} (11-11)

なので、結局

T=\displaystyle\frac{2}{3k}E_{ind} (11-12)

となります。つまり、温度は粒子1個の平均エネルギーの定数倍でした。

次に、系全体のエネルギーEは、粒子1個の平均エネルギーE_{ind}に粒子数Nを掛けたものですから式(11-12)は

T=\displaystyle\frac{2E}{3Nk} (11-13)

とも書けます。また、この式を変形して

E=\displaystyle\frac{3}{2}NkT (11-14)

と書くことも出来ます。また、式(11-4)を考慮すれば

E=\displaystyle\frac{3}{2}pV (11-15)

と書くことも出来ます。

統計力学においてエントロピーは、微視的状態の数の対数、と定義されます。

と言われてもすぐには納得出来ません。どうしてそう言えるのかについて私は、理想気体の場合の理由付けしか見つけることが出来ませんでした。もっと一般の場合でも、エントロピーを微視的状態の数の対数である、と言える根拠がきっとあるはずですが、まだそれを理解出来ておりません。

ここでは、まず理想気体の微視的状態の数を求めます。

しかしその前に微視的状態の数とは何か、ということをはっきりさせる必要があります。その説明の基礎には位相空間、またの名をΓ空間、という概念がありますので、まずはそれを説明します。

N個の粒子からなる系を考えます。例えば理想気体を考えます。このときNの数は非常に膨大になります。この系の運動状態は、個々の粒子のx,y,zの3つの座標と3つの運動量p_x,p_y,p_zN個の粒子すべてについて書き出したもので表すことが出来ます。つまり6N個の実数で表すことが出来ます。この6N個の実数を6N次元上の点として考えます。この6N次元の空間が「位相空間」と呼ばれるものです。なお、1粒子が作る6次元の空間を「μ空間」と呼び、複数個の粒子から作る6N次元の空間を「Γ空間」と呼びます。

このΓ空間上の1点を指定すれば、全粒子の運動状態が完全に指定されることになります。そして各点はニュートン力学に従ってその位置と運動量を変化させていくので、Γ空間上の点は時間とともに移動することになります。この点が微視的状態を表しています。

今、系が平衡状態になっているとします。すると我々はその系の巨視的状態に関する量(温度や圧力など)を測定することが出来ます。しかし、巨視的状態が平衡状態で、時間とともに変化しないとしても、系の微視的状態は先ほど述べたように刻々と変化しているはずです。ここから多くの微視的状態を巨視的に見ると1つの状態にしか見えないことが分かります。1つの巨視的状態に対応する微視的状態の集合を考えると、それはΓ空間の部分空間になります。最初に述べた統計力学におけるエントロピーの定義に出てくる微視的状態の数というのは、この部分空間の中にある微視的状態の数、ということです。

ところが、微視的状態は点なのでΓ空間上で大きさを持ちません。そうすると、Γ空間上の部分空間の中の点の数というのは無限大になってしまい、数えることが出来ません。これでは困ります。そこで、便宜上、微視的状態の点の1個のまわりの微小な体積を考え、この微小な空間を1つの微視的状態と考え直すことにします。これは不自然な考え方ですが、量子力学を考えると逆に自然な考え方になります。とは言え、統計力学量子力学が建設されるより前の時代に建設されたので、古典力学の論理だけから考えを進めると、やはりここに考え方の飛躍があるように見えます。この飛躍をボルツマンはどのように行ったのか、私は勉強不足で理解しておりません。

こうして微視的状態が体積(Γ空間は6N次元なので、厳密に言えば「超体積」とでもいうべきでしょう)を持つと考えた時、次に問題になるのがその体積をいかに決めるか、ということです。これも量子力学ではプランク定数hを用いてh^{3N}の体積を考えればよいことが分かっていますが、古典力学の論理ではこの値は出てきません。古典力学の論理では微視的状態の体積を任意に決めることが出来ることになります。そうすると、ある巨視的状態を構成する微視的状態の数は微視的状態の体積の決め方によって変化することになるので、このような数え方を基礎とするエントロピーの定義には不安を感じてしまいます。それでも少し安心出来るのは、上に述べたエントロピーの定義では、「微視的状態の数」そのものとして定義しているわけではなく、その対数をエントロピーと定義しているので、微視的状態に対応する空間の大きさの違いは、エントロピーに定数を加える違いとしてしか反映されない、という点です。

一方、「熱力学におけるエントロピー」で定義したエントロピーは、ある基準状態からの差として定義されているので、これも基準の取り方によって値が変わります。ですので、両者の基準をうまく取ることによって、同じ値を得ることが可能になります。

こんな変なことを考えなくても、単純に巨視的状態に対応する部分空間の体積をそのまま使えばよいではないか、とも考えられますが、この数の対数を取りたいので、対数関数\logの中身が無次元の変数であるのが望ましいです。このために、体積ではなく、微視的状態の数を用いています。部分空間の体積を直接使うと、それは3N次元の長さかける3N次元の運動量の次元(つまり、質量×長さ/時間の3N乗)の次元になります。ですので、質量、長さ、時間の単位を何にするかによってこの値が変わってきます。とはいえ、単位の違いによるエントロピーの値の違いは、上で述べたように一定値になります。

ここではΓ空間の部分空間の体積をそのまま使うやり方で、理想気体の(統計力学における)エントロピーを求め、次にそれが熱力学で定義したエントロピーに等しいことを示すことにします。

次は、統計力学においてエントロピーがどう定義されるかについて述べることになります。
しかしその前に、統計力学で定義したエントロピーが熱力学で定義したエントロピーに一致することを示す際に使う、エントロピーSに関わる式を2つ押さえておきます。それらの式は以下のものです。

\displaystyle\left(\frac{\partial{S}}{\partial{U}}\right)_V=\frac{1}{T} (10-1)

\displaystyle\left(\frac{\partial{S}}{\partial{V}}\right)_U=\frac{p}{T} (10-2)

ただしUは気体の内部エネルギーであり、Vは気体の体積であり、pは気体の圧力です。

ここでは、この2つの式を導出しておきます。まず、熱力学の第1法則、すなわちエネルギー保存則から次の式が成り立ちます。

dU=dQ+dW (10-3)

Wは気体に対してなされる仕事、Qは気体に与える熱量です。気体の場合微小な仕事dW-pdVと表すことが出来ます。気体に仕事がなされると体積Vは減りますから、マイナスがついています。よって、式(10-3)は

dU=dQ-pdV (10-4)

となります。一方「熱力学におけるエントロピー」の最後に書いたように

\displaystyle{S}=\int\frac{dQ}{T} (9-7)

でした。よって

dS=\displaystyle\frac{dQ}{T} (10-5)

となります。式(10-4)と式(10-5)から

dU=TdS-pdV (10-6)

となり、

dS=\displaystyle\frac{1}{T}dU+\frac{p}{T}dV (10-7)

となります。つまり、この式ではSの微小変化がUの微小変化とVの微小変化の和として表されています。SUVの関数S(U,V)として表した場合、

dS=\displaystyle\left(\frac{\partial{S}}{\partial{U}}\right)_VdU+\left(\frac{\partial{S}}{\partial{V}}\right)_UdV (10-8)

と書くことが出来ます。式(10-7)と式(10-8)の右辺を比較することにより

\displaystyle\left(\frac{\partial{S}}{\partial{U}}\right)_V=\frac{1}{T} (10-1)

\displaystyle\left(\frac{\partial{S}}{\partial{V}}\right)_U=\frac{p}{T} (10-2)

をいうことが出来ます。

2つの熱源を持つカルノーサイクルでは、

\displaystyle\frac{Q_H}{T_H}+\frac{Q_L}{T_L}=0 (8-14)

でした。ここで

\displaystyle\frac{Q}{T} (9-1)

という量を考えます。すると、カルノーサイクルを1周する経路に沿ってQ/Tを足したものはゼロになる、ということが言えます。つまり、
1.気体を高熱源に接触させて、高熱源の温度を保ったまま、準静的に気体を膨張させる。(体積に反比例して圧力が減少する。)

この時、\displaystyle\frac{Q_H}{T_H}

2.高熱源を離して、断熱の状況で、低熱源の温度になるまで準静的に気体を膨張させる。
この時、温度は変化するが熱量Qの出入りはないので、1と2での(9-1)の合計値は

\displaystyle\frac{Q_H}{T_H}+0

3.気体を低熱源に接触させて、低熱源の温度に保ったまま、準静的に気体を圧縮する。(体積に反比例して圧力が増加する。)
1から3までの(9-1)の合計値は

\displaystyle\frac{Q_H}{T_H}+0+\frac{Q_L}{T_L}

4.低熱源を離して、断熱の状況で、高熱源の温度になるまで準静的に体積を圧縮する。
1から4までの(9-1)の合計値は

\displaystyle\frac{Q_H}{T_H}+0+\frac{Q_L}{T_L}+0

となりますが、式(8-14)よりこの合計値はゼロになります。

さて、微小なカルノーサイクルを複数組み合わせることで、気体の状態が元に戻るような任意の準静的な閉じた経路を近似することが出来ます。細かい説明は省きますが、カルノーサイクルにおける式(8-14)を組み合わせることにより、この閉じた経路を一周する周回積分

\displaystyle\oint\frac{dQ}{T}=0 (9-2)

が成り立ちます。

次に、気体のある状態(A)から別の状態(B)に到達するような準静的な経路を2つ考えます。片方の経路をAB1、もう片方の経路をAB2と名付けます。経路AB1に沿ってのAからBまでのdQ/T積分

\displaystyle\int_{A(AB1)}^B\frac{dQ}{T}

経路AB2に沿ってのAからBまでのdQ/T積分

\displaystyle\int_{A(AB2)}^B\frac{dQ}{T}

と表すことにします。また、経路AB2を逆にBからAに向かってたどった場合の経路をBA2で表し、経路BA2に沿っての積分

\displaystyle\int_{B(BA2)}^A\frac{dQ}{T}

で表すことにします。積分の定義から

\displaystyle\int_{B(BA2)}^A\frac{dQ}{T}=-\int_{A(AB2)}^B\frac{dQ}{T} (9-3)

が成り立ちます。一方、経路AB1でBまでたどり、次にBA2でAまで戻ってくる経路は閉じた経路になるので、式(9-2)から

\displaystyle\int_{A(AB1)}^B\frac{dQ}{T}+\int_{B(BA2)}^A\frac{dQ}{T}=\oint\frac{dQ}{T}=0

よって

\displaystyle\int_{A(AB1)}^B\frac{dQ}{T}=-\int_{B(BA2)}^A\frac{dQ}{T} (9-4)

となります。この式と式(9-3)から

\displaystyle\int_{A(AB1)}^B\frac{dQ}{T}=\int_{A(AB2)}^B\frac{dQ}{T} (9-5)

つまり、

\displaystyle\int_A^B\frac{dQ}{T} (9-6)

の値は、途中の経路に依存しないことが分かります。

このことから、式(9-6)で与えられる量が状態量(経路に依存せずに状態にのみ依存する量)であることが分かります。例えば状態Aの時のその量の値をゼロとすれば、つまり、状態Aを基準とすれば、式(9-6)によって、さまざまな状態における、この量が定義出来ます。
この量を学者たちは**エントロピー**と名付けたのでした。

よって、エトロピーSは、

\displaystyle{S}=\int\frac{dQ}{T} (9-7)

で定義されます。

次に以下を証明します。

(3) \displaystyle\frac{Q_H}{Q_L}は、\displaystyle\frac{f(T_H)}{f(T_L)}と書ける。

ここにf(T)は温度の関数ですが、まだこの関数の形については何もいえません。

この証明ですが、高低の2つの熱源のほかに低より低い極低の熱源を考えます。高熱源の温度をT_H、低熱源の温度をT_L、極低熱源の温度をT_{LL}で表すことにします。高熱源と低熱源を用いたカルノーサイクルを考えると、このカルノーサイクルは高熱源からQ_Hの熱量をもらい、低熱源にQ_Lの熱量を捨てている、と考えることが出来ます。このとき前回「カルノーサイクル(1)」での言明(2)により、

\displaystyle\frac{Q_H}{Q_L}=F(T_H, T_L) (8-6)

が成り立ちます。ここでFは、T_HT_Lの関数を表しています。
次に低熱源と極低熱源を用いたカルノーサイクルを考えます。そしてこのカルノーサイクルは低熱源からQ_Lの熱量をもらい、極低熱源にQ_{LL}の熱量を捨てる、とします。
すると、今度は以下が成り立ちます。

\displaystyle\frac{Q_L}{Q_{LL}}=F(T_L, T_{LL}) (8-7)

これら2つのカルノーサイクルをまとめると、高熱源からQ_Hをもらって極低熱源にQ_{LL}捨てる1つのカルノーサイクルとみなすことが出来ます。よって

\displaystyle\frac{Q_H}{Q_{LL}}=F(T_H, T_{LL}) (8-8)

式(8-6), (8-7), (8-8)から

F(T_H, T_{LL})=F(T_H, T_L)F(T_L, T_{LL})

よって

F(T_H, T_L)=\displaystyle\frac{F(T_H, T_{LL})}{F(T_L, T_{LL})} (8-9)

ここで、T_{LL}を固定してF(T, T_{LL})f(T)と書けば

F(T_H, T_M)=\displaystyle\frac{f(T_H)}{f(T_L)} (8-10)

と書けます。よって

\displaystyle\frac{Q_H}{Q_L}=\displaystyle\frac{f(T_H)}{f(T_L)} (8-11)

と書けます。これで上記(3)が証明されました。

最後に、**(4)f(T)=Tである**、ということを証明したいのですが、カルノーサイクルの考察からはf(T)の形を決めることは出来ません。それはなぜかというと、今まで考察の土台にしてきたのはエネルギーの保存則と

低温の熱源から高温の熱源に正の熱を移す以外に、他に何の痕跡も残さないようにすることは出来ない。

というクラウジウスの原理だけだからです。エネルギーの保存則は温度とは関係がありませんし、クラウジウスの原理には低温の熱源と高温の熱源が登場しますが、その高低が問題になっているだけで、温度をどのように目盛るかについては述べていないからです。ただし、Q_H{>}Q_Lなので、式(8-11)によりf(T_H){>}f(T_L)になるはずです。定義上T_H{>}T_Lなので、f(T)は増加関数であることが分かります。関数f(T)の形が決まらないならば、逆にf(T)=Tとなるように温度を定義してしまおう、という考え方が提案されました。この定義を用いると式(8-12)は

\displaystyle\frac{Q_H}{Q_L}=\displaystyle\frac{T_H}{T_L} (8-12)

となります。

とはいえ、一方で気体の振る舞いを理想化した理想気体の状態方程式

pV=nRT (8-13)

ではすでに絶対温度Tが登場していました。ここで登場する絶対温度Tと式(8-12)で定義されるTが同じものであるかどうかが気になります。これについては別途扱いたいと思います。

さて式(8-12)式を変形すると

\displaystyle\frac{Q_H}{T_H}=\displaystyle\frac{Q_L}{T_L} (8-13)

となります。ここで、Q_Hは気体に入る熱量であり、Q_Lは気体から出ていく熱量なので、気体に入るほうを正の熱量と考えて統一すると、

\displaystyle\frac{Q_H}{T_H}+\frac{Q_L}{T_L}=0 (8-14)

と書けます。ここからエントロピーの話が出てくるのですが、それについては次回説明することにします。

さて、前回の「Fが自由エネルギーと呼ばれる理由」の中で

S=-\displaystyle{\int}q(x)\log{q(x)}dx (7-2)

で定義されたSエントロピーと見なす、というふうに説明しました。
しかし私自身、これがなぜエントロピーであると言えるのかについて、前回の時点では説明出来なかったので、しばらく熱力学と統計力学を勉強していました。しばらくは、その勉強の結果をまとめていきます。

まず、エントロピーという量が定義されたのは熱力学の世界においてでした。
熱力学が建設されていた時代には熱の正体が分子のランダムな運動のエネルギーである、ということはまだ判明しておりませんでした。そこで、熱とは何か、という問題を棚上げしておき、熱がどのような振る舞いをするのかの原理を、観測結果を元に追及してきました。
この熱力学でどのようにしてエントロピーという量が見つけ出されたのかをまず、押さえておきたいと思います。そのためにはカルノーサイクルの話をしなくてはなりません。

カルノーサイクル

カルノーサイクルは気体と2つの熱源(一方を高熱源、他方を低熱源と呼ぶ)から成る熱機関です。熱機関とは熱を仕事に変える機関です。カルノーサイクルでは熱を高熱源から得て、その一部を仕事に変換し、残りの熱を低熱源に捨てます。低熱源に捨てることなく、高熱源から得られた熱を全て仕事に変えてしまうことが出来れば素晴らしいのですが、そのようなことは不可能であることが分かっています。

また、カルノーサイクルでは準静的過程のみを使っています。カルノーサイクルでは4つの過程を用いています。

1.気体を高熱源に接触させて、高熱源の温度を保ったまま、準静的に気体を膨張させる。(体積に反比例して圧力が減少する。)
2.高熱源を離して、断熱の状況で、低熱源の温度になるまで準静的に気体を膨張させる。
3.気体を低熱源に接触させて、低熱源の温度に保ったまま、準静的に気体を圧縮する。(体積に反比例して圧力が増加する。)
4.低熱源を離して、断熱の状況で、高熱源の温度になるまで準静的に体積を圧縮する。

全て準静的な変化を用いているので、これは厳密に言えば現実にあり得ない理想的な機関です。この4つを順次行うことを1サイクルと呼びます。また、この1サイクルを逆に変化させることを逆サイクルと言います。つまり、以下のようなサイクルになります。

1’.気体を高熱源に接触させて、高熱源の温度を保ったまま、準静的に気体を圧縮する。(体積に反比例して圧力が増加する。)
4’.高熱源を離して、断熱の状況で、低熱源の温度になるまで準静的に体積を膨張させる。
3’.気体を低熱源に接触させて、低熱源の温度に保ったまま、準静的に気体を膨張させる。(体積に反比例して圧力が減少する。)
2’.低熱源を離して、断熱の状況で、高熱源の温度になるまで準静的に気体を圧縮する。

さて、このカルノーサイクルを考察していきます。まず、次を証明します。

(1) 高熱源の温度T_Hと低熱源の温度T_L、仕事量Wを定めると、1サイクルで高熱源からもらう熱量Q_Hと、低熱源へ捨てる熱量Q_Tの値は決まる。

もし2つのカルノーサイクルA, Bがあり、それらのT_H, T_L, Wが一緒であるとします。Aが高熱源からもらう熱量をQ_{HA}、Bが高熱源からもらう熱量をQ_{HB}で表します。もし、Q_{HA}>Q_{HB}だとすると、カルノーサイクルAを逆サイクルで動かすと、Aは仕事Wを外部からもらって高熱源に熱量Q_{HA}返すことになります。この仕事WはBが供給するとすると、逆サイクルのAと順サイクルのBの両者を全体で見た場合、外部からの仕事を受けずに高熱源に熱量Q_H=Q_{HA}-Q_{HB}>0を与えたことになります。そして全体では仕事Wはゼロなので、この熱量Q_Hは、エネルギー保存則から考えて、低熱源から供給されたものになります。

これは

低温の熱源から高温の熱源に正の熱を移す以外に、他に何の痕跡も残さないようにすることは出来ない。

というクラウジウスの原理に反することになります。

逆にQ_{HA}<{Q}_{HB}の場合は、順サイクルのAと逆サイクルのBから成るシステムを考えれば、同じことが言えます。

よって、ここからQ_{HA}=Q_{HB}をいうことが出来、T_H, T_L,Wを定めると、1サイクルで高熱源からもらう熱量Q_Hが定まることが分かります。一方、低熱源へ捨てる熱量Q_Lについてですが、エネルギー保存の法則からQ_L=Q_H-Wとなるので、Q_Hが定まれば、Q_Lも定まります。よって、これで上記(1)が証明されました。なお、この証明ではカルノーサイクルに用いる気体の種類を特定していないことに注意して下さい。上記(1)は理想気体だけでなく、あらゆる気体について言えます。

次に以下を証明します。
(2) \displaystyle\frac{Q_H}{Q_L}は、T_HT_Lの関数であり、Wには依存しない。

1つのカルノーサイクルがQ_Hの熱量を受け取って、外部にWの仕事をするものとします。このカルノーサイクルをn個並べるとnQ_Hの熱量を受け取って、外部にnWの仕事をする熱機関が出来ます。上記(1)で高熱源から受け取る熱量Q_HT_H, T_L, Wから決まるのでしたから、これを関数の形にして、以下のように表すことにします。

Q_H=f_H(T_H, T_L, W) (8-1)

するとカルノーサイクルをn個並べたものについては

nQ_H=f_H(T_H, T_L, nW) (8-2)

となるはずです。同様にして、

Q_L=f_L(T_H, T_L, W) (8-3)
nQ_L=f_L(T_H, T_L, nW) (8-4)

が言えます。

式(8-1)の両辺を式(8-3)の両辺で割ると以下のようになります。

\displaystyle\frac{Q_H}{Q_L}=\frac{f_H(T_H, T_L, W)}{f_L(T_H, T_L, W)} (8-5)

次に、式(8-2)の両辺を式(8-4)の両辺で割ると以下のようになります。

\displaystyle\frac{Q_H}{Q_L}=\frac{f_H(T_H, T_L, nW)}{f_L(T_H, T_L, nW)} (8-6)

式(8-5)の左辺と式(8-6)の左辺は同じなので、両者の値は等しいです。よって、

\displaystyle\frac{Q_H}{Q_L}=\frac{f_H(T_H, T_L, W)}{f_L(T_H, T_L, W)}=\frac{f_H(T_H, T_L, nW)}{f_L(T_H, T_L, nW)}

これはつまり、

\displaystyle\frac{Q_H}{Q_L}が、仕事量Wに依存していないことを示しています。

これで上記(2)が証明出来ました。