【発展】合成関数の微分と逆関数の微分の導出(少し厳密ver)

ここでは、合成関数の微分や逆関数の微分の公式の導出を、もう少し厳密に行っていきたいと思います。

【広告】

合成関数の微分の導出(少し厳密ver)

【基本】合成関数の微分で見たように、微分可能な2つの関数 $f(x),g(x)$ に対して、 $g(f(x))$ を微分すると $g'(f(x))f'(x)$ となることを見ました。これを示すために
\begin{eqnarray}
& &
\lim_{h\to 0} \frac{g(f(x+h))-g(f(x))}{h} \\[5pt] &=&
\lim_{h\to 0} \frac{g(f(x+h))-g(f(x))}{f(x+h)-f(x)} \cdot \frac{f(x+h)-f(x)}{h} \\[5pt] \end{eqnarray}と変形したのでした。こうすると、後半部分は $f'(x)$ に収束し、前半部分は(もう少し変形が必要ですが) $g'(f(x))$ に収束する、と書きました。

この示し方は一般的な高校の教科書にも載っていますが、厳密にいうと正しくありません。 $f(x+h)-f(x)$ が $0$ となってしまう可能性があり、この場合は上のような式変形ができません。

このことが問題になるのは、例えば $f(x)$ が定数のとき、などです。ただ、合成関数の微分を使いたいときにこのことが問題になることはほとんどありません。そのため、この問題は無視されていますが、ここでは、このことも回避する証明を考えてみます。

【広告】

2つの分数に分けたときに、分母が0になってしまう可能性が問題となるのでした。なので、「2つの分数に分ける」という発想を封印することにしましょう。

ちょっと記号が多くなってしまいますが、いくつかの記号を準備します。まず、 $u=f(x)$ とおきましょう。また、 $h\ne 0$ のときに、
\begin{eqnarray}
& (x+h)-x &=& \Delta x \\[5pt] & f(x+h)-f(x) &=& \Delta u \\[5pt] & g(f(x+h))-g(f(x)) &=& \Delta y \\[5pt] \end{eqnarray}と置きます。この $\Delta$ は、変化量を表しています。例えば、 $x$ の変化量は $\Delta x$ で表し、この2文字をひとまとめにして、一つの量を表しています。ちなみに、まわりにあわせるために $\Delta x$ も導入しましたが、 $\Delta x$ とは、ただの $h$ のことです。

この $\Delta$ を使って微分を表現すると
\begin{eqnarray}
\lim_{h\to 0} \frac{f(x+h)-f(x)}{h} = \lim_{\Delta x\to 0} \frac{\Delta u}{\Delta x}=\dfrac{du}{dx} \\[5pt] \end{eqnarray}となります。 $\Delta$ と $d$ とが対応している、と考えられます。

ここで、 $\Delta x\ne 0$ のときに、\[ \varepsilon_1 = \frac{\Delta u}{\Delta x} -f'(x) \]と置くことにしましょう。 $\varepsilon_1$ は、 $x$ と $\Delta x$ によって値が決まる関数です。このとき、 $\Delta x\to 0$ とすると、右辺は $0$ に収束するので、 $\varepsilon_1\to 0$ となります。また、 $\Delta x=0$ のときは $\varepsilon_1=0$ と定義しておきます。この値を後で使うことはないのですが。

$\varepsilon_1$ の式を変形すると\[ \Delta u=(\varepsilon_1+f'(x))\Delta x \]となることにも注意しましょう。 $\Delta x\to 0$ のときに $\Delta u\to 0$ となることは、「微分可能なら連続」を表していますが、この変形後の式からもわかりますね。

$\varepsilon_1$ の式を踏まえて、次のような $\varepsilon_2$ も考えてみましょう。\[ \Delta y=(\varepsilon_2+g'(u))\Delta u \]$\varepsilon_2$ は、 $u$ と $\Delta u$ によって値が決まる関数です。こうすると、 $\Delta u\ne 0$ のときは\[ \varepsilon_2 = \frac{\Delta y}{\Delta u} -g'(u) \]と書け、 $\Delta u\to 0$ のときに $\varepsilon_2 \to 0$ となることがわかります。ここでも、 $\Delta u=0$ のときは $\varepsilon_2=0$ と定義しておきます。

さて、ここまでの式を使って、微分を計算してみましょう。合成関数の微分を考えたいのですが、そのためには次の極限を計算する必要があります。\[ \lim_{h\to 0} \frac{g(f(x+h))-g(f(x))}{h} \]極限を考える前では、分子は $\Delta y$ であり、分母は $\Delta x$ です。先ほど導入した $\varepsilon_1$ などを使えば、
\begin{eqnarray}
& &
\dfrac{\Delta y}{\Delta x} \\[5pt] &=&
\dfrac{(\varepsilon_2+g'(u))\Delta u}{\Delta x} \\[5pt] &=&
\dfrac{(\varepsilon_2+g'(u))(\varepsilon_1+f'(x))\Delta x}{\Delta x} \\[5pt] &=&
(\varepsilon_2+g'(u))(\varepsilon_1+f'(x)) \\[5pt] \end{eqnarray}となります。ここで、 $h=\Delta x\to 0$ とすると、 $\varepsilon_1 \to 0$ となり、さらに $\Delta u\to 0$ となるから $\varepsilon_2 \to 0$ も成り立ちます。よって、極限を考えると
\begin{eqnarray}
& &
\lim_{h\to 0} \frac{g(f(x+h))-g(f(x))}{h} \\[5pt] &=& g'(u)f'(x)=g'(f(x))f'(x)
\end{eqnarray}となり、合成関数の微分の公式が導かれます。

ポイントとなるのは、 $y$ の変化量は、「 $u$ の変化量×微分係数+誤差」と書け、 $u$ の変化量が「 $x$ の変化量×微分係数+誤差」と書けることです。極限を考えるときに、ここに出てくる誤差は0に収束します。よって、 $y$ の変化量を $x$ の変化量で割ったものの極限を計算すると、 $g'(f(x))f'(x)$ の部分だけが残る、という仕組みになっています。

2つの分数に分ける方法に比べると、かなりわかりづらいですね。2つの分数に分ける方法なら
\begin{eqnarray}
& &
\lim_{h\to 0} \frac{g(f(x+h))-g(f(x))}{h} \\[5pt] &=&
\lim_{\Delta x\to 0} \frac{\Delta y}{\Delta x} \\[5pt] &=&
\lim_{\Delta x\to 0} \frac{\Delta y}{\Delta u}\cdot \frac{\Delta u}{\Delta x} \\[5pt] &=&
\lim_{\Delta u\to 0} \frac{\Delta y}{\Delta u} \cdot \lim_{\Delta x\to 0} \frac{\Delta u}{\Delta x} \\[5pt] &=&
\frac{dy}{du}\cdot\frac{du}{dx} \\[5pt] \end{eqnarray}と書けてしまいます。 $\Delta u=0$ のときにどうするかという問題はありますが、この方法で説明したくなる気持ちはわかります。

【広告】

逆関数の微分の導出(少し厳密ver)

【基本】逆関数の微分で見たように、\[ \frac{dy}{dx}=\frac{1}{\dfrac{dx}{dy}} \]が成り立ちます(分母が $0$ のところを除く)。これを示すために、ある関数 $f(x)$ に対して、逆関数 $g(x)$ が存在し、 $g(x)$ は微分可能であると仮定して、 $x=g(y)$ の両辺を $x$ で微分してみました。これにより
\begin{eqnarray}
1 &=& \dfrac{d}{dx} g(y) \\[5pt] &=& \dfrac{d}{dy} g(y) \cdot \dfrac{dy}{dx} \\[5pt] &=& \dfrac{dx}{dy} \cdot \dfrac{dy}{dx} \\[5pt] \end{eqnarray}となります。2つ目の等号では、合成関数の微分を用いています。これから、先ほどの逆関数の微分を導きました。

この方法は、高校の教科書にも載っていますが、これも厳密にいうと正しくありません。合成関数の微分を使うには、 $f(x)$ が微分可能でないといけませんが、そもそも微分可能かどうかは調べていませんでした。

本来なら、微分の定義に戻って考えていかなくてはいけませんが、逆関数の微分を定義から考えていくと、少し難しい部分が出てきてしまいます。ここでは、「 $f(x)$ が、ある区間で定義された連続関数であること」を仮定して、計算していくことにしましょう。

\[ \lim_{h\to 0}\frac{f(x+h)-f(x)}{h} \]を考えましょう。ここで、 $f(x)=y$, $f(x+h)=f(x)+k$ とおきます。関数 $g(x)$ は関数 $f(x)$ の逆関数なので、
\begin{eqnarray}
g(y)=g(f(x))=x
\end{eqnarray}であり、
\begin{eqnarray}
g(y+k)=g(f(x+h))=x+h
\end{eqnarray}なので、\[ h=(x+h)-x=g(y+k)-g(y) \]と書くことができます。よって、
\begin{eqnarray}
& &
\frac{f(x+h)-f(x)}{h} \\[5pt] &=&
\frac{k}{g(y+k)-g(y)} \\[5pt] \end{eqnarray}と変形することができます。ここで、 $f(x+h)=f(x)+k$ であり、今は $f(x)$ は連続だと仮定しているので、 $h\to 0$ なら $k\to 0$ となることがわかります。また、逆関数が存在することから、 $h\ne 0$ のときは $f(x+h)\ne f(x)$ なので、 $k\ne 0$ です。よって、 $g'(y)\ne 0$ のときは、
\begin{eqnarray}
& &
\lim_{h\to 0}\frac{f(x+h)-f(x)}{h} \\[5pt] &=&
\lim_{k\to 0} \frac{k}{g(y+k)-g(y)} \\[5pt] &=&
\lim_{k\to 0} \frac{1}{\frac{g(y+k)-g(y)}{k}} \\[5pt] &=&
\frac{1}{g'(y)}
\end{eqnarray}となることがわかります。

【広告】

おわりに

ここでは、合成関数の微分と逆関数の微分について、少し厳密に導出してみました。高校の教科書に載っているものはわかりやすいですが、厳密にいうとあやしいところがあるので、そこをクリアにしました。厳密にはなりましたが、わかりやすさでいうと、だいぶ難しくなってしまったようにも思います。