Анализ и формализация понятия производной#

1. Предпосылки: задачи о касательной и мгновенной скорости#

Аппарат дифференциального исчисления, разработанный в трудах Исаака Ньютона и Готфрида Лейбница в XVII веке, возник не на пустом месте. Он стал ответом на давно стоявшие перед математиками и физиками вопросы. Рассмотрим два ключевых из них.

1.1. Геометрическая задача: построение касательной к кривой#

Рассмотрим произвольную плоскую кривую, заданную как график функции \(y = f(x)\). Что такое касательная к этой кривой в некоторой точке \(M_0(x_0, y_0)\)? Интуитивно мы представляем ее как прямую, которая «прикасается» к кривой в данной точке, наилучшим образом повторяя ее направление в бесконечно малой окрестности этой точки.

Для формализации этого понятия воспользуемся методом секущих. Возьмем на кривой еще одну точку:

\[M_1(x_0 + \Delta x, y_0 + \Delta y)\]

где \(\Delta x\) — некоторое приращение аргумента, а \(\Delta y = f(x_0 + \Delta x) - f(x_0)\) — соответствующее приращение функции. Проведем через точки \(M_0\) и \(M_1\) прямую, называемую секущей.

Угловой коэффициент этой секущей, который определяет тангенс угла ее наклона к оси абсцисс, вычисляется тривиально:

\[k_{\text{сек}} = \tan \varphi = \frac{\Delta y}{\Delta x} = \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x}\]

Теперь будем неограниченно приближать точку \(M_1\) к точке \(M_0\) вдоль кривой. Это эквивалентно устремлению приращения аргумента \(\Delta x\) к нулю. Если при этом угловой коэффициент секущей \(k_{\text{сек}}\) стремится к некоторому определенному конечному пределу, то этот предел и есть угловой коэффициент искомой касательной.

\[k_{\text{кас}} = \lim_{\Delta x \to 0} k_{\text{сек}} = \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x}\]

Таким образом, геометрический смысл величины, которую мы собираемся определить, заключается в том, что она равна угловому коэффициенту касательной к графику функции в данной точке.

1.2. Физическая задача: определение мгновенной скорости#

Рассмотрим материальную точку, движущуюся прямолинейно по закону \(s = s(t)\), где \(s\) — координата точки в момент времени \(t\). За промежуток времени от \(t_0\) до \(t_0 + \Delta t\) точка пройдет путь \(\Delta s = s(t_0 + \Delta t) - s(t_0)\).

Средняя скорость движения за этот промежуток времени определяется как отношение пройденного пути ко времени, за которое он был пройден:

\[v_{\text{ср}} = \frac{\Delta s}{\Delta t} = \frac{s(t_0 + \Delta t) - s(t_0)}{\Delta t}\]

Однако средняя скорость не дает информации о скорости движения в конкретный момент времени \(t_0\). Чтобы определить мгновенную (или истинную) скорость, мы должны рассмотреть предел, к которому стремится средняя скорость, когда промежуток времени \(\Delta t\) стягивается в точку, то есть \(\Delta t \to 0\).

\[v(t_0) = \lim_{\Delta t \to 0} v_{\text{ср}} = \lim_{\Delta t \to 0} \frac{s(t_0 + \Delta t) - s(t_0)}{\Delta t}\]

Мы видим, что математическая конструкция, к которой мы пришли, полностью аналогична той, что возникла в задаче о касательной. Это универсальное отношение лежит в основе формального определения производной.

2. Формальное определение производной#

Перейдем к строгому определению.

Определение. Производной функции \(y = f(x)\) в точке \(x_0\) называется предел отношения приращения функции \(\Delta y\) к вызвавшему его приращению аргумента \(\Delta x\) при условии, что приращение аргумента стремится к нулю.

Для производной используются следующие стандартные обозначения:

  • Обозначение Лагранжа: \(f'(x_0)\)

  • Обозначение Лейбница: \(\frac{dy}{dx}\bigg|_{x=x_0}\) или \(\frac{df}{dx}(x_0)\)

  • Обозначение Ньютона (в основном в механике): \(\dot{y}(t_0)\)

Таким образом, по определению:

\[f'(x_0) = \lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x}\]

Важнейшие замечания:

  1. Производная существует только в том случае, если указанный предел существует и конечен.

  2. Предел должен быть одинаковым независимо от того, с какой стороны \(\Delta x\) стремится к нулю (справа, \(\Delta x \to 0+\), или слева, \(\Delta x \to 0-\)). Пределы справа и слева называют, соответственно, правой и левой производными. Для существования производной необходимо и достаточно, чтобы существовали и были равны правая и левая производные.

  3. Операция нахождения производной называется дифференцированием.

Эквивалентная форма записи определения, получаемая заменой \(x = x_0 + \Delta x\) (откуда \(\Delta x = x - x_0\)):

\[f'(x_0) = \lim_{x \to x_0} \frac{f(x) - f(x_0)}{x - x_0}\]

3. Дифференцируемость и непрерывность#

Возникает естественный вопрос: как связаны между собой свойства дифференцируемости и непрерывности функции в точке? Ответ дает следующая фундаментальная теорема.

Теорема.

Если функция \(f(x)\) дифференцируема в точке \(x_0\), то она непрерывна в этой точке.

Доказательство.

То, что функция \(f(x)\) дифференцируема в точке \(x_0\), означает, что существует конечный предел:

\[ f'(x_0) = \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} \]

Нам нужно доказать, что функция непрерывна в точке \(x_0\), то есть, по определению непрерывности, что:

\[ \lim_{\Delta x \to 0} f(x_0 + \Delta x) = f(x_0), \]

или, что эквивалентно:

\[ \lim_{\Delta x \to 0} \left( f(x_0 + \Delta x) - f(x_0) \right) = 0. \]

Рассмотрим приращение функции:

\[ \Delta y = f(x_0 + \Delta x) - f(x_0). \]

Выполним тождественное преобразование для \(\Delta x \neq 0\):

\[ f(x_0 + \Delta x) - f(x_0) = \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} \cdot \Delta x. \]

Теперь перейдем к пределу при \(\Delta x \to 0\) в обеих частях равенства:

\[ \lim_{\Delta x \to 0} \left( f(x_0 + \Delta x) - f(x_0) \right) = \lim_{\Delta x \to 0} \left( \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} \cdot \Delta x \right). \]

Используя теорему о пределе произведения, получаем:

\[ \lim_{\Delta x \to 0} \left( f(x_0 + \Delta x) - f(x_0) \right) = \left( \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} \right) \cdot \left( \lim_{\Delta x \to 0} \Delta x \right). \]

Первый предел в правой части по условию теоремы есть \(f'(x_0)\) (конечное число), а второй предел очевидно равен нулю.

Следовательно:

\[ \lim_{\Delta x \to 0} \left( f(x_0 + \Delta x) - f(x_0) \right) = f'(x_0) \cdot 0 = 0. \]

Это и доказывает непрерывность функции в точке \(x_0\). Что и требовалось доказать.

Обратное утверждение неверно!
Непрерывность функции в точке не гарантирует ее дифференцируемости. Классический контрпример — функция \(f(x) = |x|\) в точке \(x_0 = 0\). Она, очевидно, непрерывна в этой точке. Однако, найдем ее левую и правую производные:

  • Правая производная:
    $\( f'_+(0) = \lim_{\Delta x \to 0+} \frac{|0 + \Delta x| - |0|}{\Delta x} = \lim_{\Delta x \to 0+} \frac{|\Delta x|}{\Delta x} = \lim_{\Delta x \to 0+} \frac{\Delta x}{\Delta x} = 1 \)$

  • Левая производная:
    $\( f'_-(0) = \lim_{\Delta x \to 0-} \frac{|0 + \Delta x| - |0|}{\Delta x} = \lim_{\Delta x \to 0-} \frac{|\Delta x|}{\Delta x} = \lim_{\Delta x \to 0-} \frac{-\Delta x}{\Delta x} = -1 \)$

Поскольку \(f'_+(0) \neq f'_-(0)\), производная в точке \(x_0 = 0\) не существует.

Геометрически это соответствует тому, что график функции в этой точке имеет «излом», и провести однозначную касательную невозможно.

4. Дифференциал функции#

Понятие производной тесно связано с концепцией линейной аппроксимации функции и понятием дифференциала.

Пусть функция \(f(x)\) дифференцируема в точке \(x_0\). Тогда по определению производной:

\[ \lim_{\Delta x \to 0} \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} = f'(x_0) \]

Это равенство по определению предела можно переписать в виде:

\[ \frac{f(x_0 + \Delta x) - f(x_0)}{\Delta x} = f'(x_0) + \alpha(\Delta x), \]

где \(\alpha(\Delta x)\) — бесконечно малая функция при \(\Delta x \to 0\), то есть \(\lim_{\Delta x \to 0} \alpha(\Delta x) = 0\).

Домножим на \(\Delta x\):

\[ f(x_0 + \Delta x) - f(x_0) = f'(x_0)\Delta x + \alpha(\Delta x)\Delta x \]

Обозначим приращение функции \(\Delta y = f(x_0 + \Delta x) - f(x_0)\). Тогда:

\[ \Delta y = f'(x_0)\Delta x + o(\Delta x) \]

Здесь \(o(\Delta x)\) (читается «о малое от дельта икс») — это член \(\alpha(\Delta x)\Delta x\), который является бесконечно малой более высокого порядка по сравнению с \(\Delta x\), то есть:

\[ \lim_{\Delta x \to 0} \frac{o(\Delta x)}{\Delta x} = 0 \]

Мы представили приращение функции \(\Delta y\) в виде суммы двух слагаемых:

  1. \(f'(x_0)\Delta x\) — линейная относительно \(\Delta x\) часть приращения.

  2. \(o(\Delta x)\) — остаточный член.

Определение.

Функция \(f(x)\) называется дифференцируемой в точке \(x_0\), если ее приращение в этой точке может быть представлено в виде:

\[ \Delta y = A \cdot \Delta x + o(\Delta x), \]

где \(A\) — некоторая константа, не зависящая от \(\Delta x\).

Определение.

Дифференциалом функции \(f(x)\) в точке \(x_0\) (обозначается \(dy\) или \(df(x_0)\)) называется главная, линейная относительно \(\Delta x\) часть ее приращения:

\[ dy = A \cdot \Delta x \]

Сравнивая два определения, мы видим, что функция дифференцируема в точке тогда и только тогда, когда в этой точке существует производная, причем \(A = f'(x_0)\).

Таким образом, дифференциал функции равен произведению ее производной на приращение независимой переменной:

\[ dy = f'(x_0)\Delta x \]

Принято называть дифференциалом независимой переменной само приращение: \(dx = \Delta x\). С учетом этого, формула принимает канонический вид:

\[ dy = f'(x)dx \]

Из этой формулы следует знаменитая запись Лейбница:

\[ f'(x) = \frac{dy}{dx}, \]

которая теперь может трактоваться не просто как символьное обозначение, а как отношение двух дифференциалов.

Геометрический смысл дифференциала.
Вспомним, что \(f'(x_0)\) — это тангенс угла наклона касательной. Тогда:

\[ f'(x_0)\Delta x = \tan \varphi \cdot \Delta x \]

есть не что иное, как приращение ординаты касательной, проведенной в точке \(x_0\), когда аргумент получает приращение \(\Delta x\).

Дифференциал \(dy\) — это приращение по касательной, в то время как \(\Delta y\) — это истинное приращение по самой кривой.

Заключение#

Итак, сегодня мы установили, что производная — это не просто абстрактная математическая операция. Это мощный инструмент, имеющий ясные интерпретации:

  • Геометрически — это угловой коэффициент касательной к графику функции.

  • Физически — это мгновенная скорость изменения процесса, описываемого функцией.

  • Аналитически — это коэффициент в главной линейной части приращения функции, что делает производную основой для линейной аппроксимации и введения понятия дифференциала.

Мы доказали, что дифференцируемость является более сильным свойством, чем непрерывность. Понятия, введенные сегодня, служат фундаментом для всего последующего курса математического анализа, включая правила дифференцирования, исследование функций и интегральное исчисление.

Спасибо за внимание.