Skip to main content

Appendix

Đạo hàm & Gradients

  • Gradient là yếu tố bắt buộc khi huấn luyện mạng nơ-ron thông qua thuật toán lan truyền ngược backpropagation. Thuật toán này áp dụng quy tắc chuỗi (chain rule) trong giải tích như hình dưới đây:

  • alt

  • Đạo hàm riêng dùng để đo lường tốc độ thay đổi của 1 hàm số đối với 1 trong các biến số của nó khi biến đó thay đổi.

  • Gradient là 1 vectơ chứa tất cả các đạo hàm riêng của 1 hàm đa biến.

    • Ví dụ: Nếu có 2 trọng số w1w_1 & w2w_2, gradient là vector L=[Lw1,Lw2]\nabla L = [\frac{\partial L}{\partial w_1}, \frac{\partial L}{\partial w_2}].