Trong bước lan truyền thuận, với giá trị đầu vào x, đầu ra của mạng neural được tính toán. Trong quá trình này, các giá trị kích hoạt al tại mỗi lớp được lưu lại để sử dụng sau.
Với mỗi đơn vị j trong lớp đầu ra, tính toán sai số:
Việc tính toán đạo hàm cho từng tham số riêng lẻ như đã mô tả ở trên rất dễ để hiểu. Tuy nhiên, trong thực tế, chúng ta cần tối ưu hóa các phép tính bằng cách diễn tả chúng dưới dạng vector và ma trận để tăng tốc độ thuật toán. Ta định nghĩa:
el=e1le2l⋮edll∈Rdl×1
Bước lan truyền thuận: Với giá trị đầu vào x được cho, tính toán đầu ra của mạng đồng thời lưu lại các giá trị kích hoạt al tại mỗi lớp.