Appendix
Đạo hàm & Gradients
-
Gradientlà yếu tố bắt buộc khi huấn luyện mạng nơ-ron thông qua thuật toánlan truyền ngượcbackpropagation. Thuật toán này áp dụngquy tắc chuỗi(chain rule) trong giải tích như hình dưới đây: -

-
Đạo hàm riêng dùng để đo lường tốc độ thay đổi của 1 hàm số đối với 1 trong các biến số của nó khi biến đó thay đổi.
-
Gradient là 1 vectơ chứa tất cả các đạo hàm riêng của 1 hàm đa biến.
- Ví dụ: Nếu có 2 trọng số & , gradient là vector .