Phát triển MLm phải cam kết với công bằng
Câu ngạn ngữ của khoa học máy tính nói rằng “rác vào, rác ra”. Điều này đặc biệt đúng trong trường hợp của MLm, vì dữ liệu huấn luyện và xác minh mà các mô hình MLm được huấn luyện trên là điều cần thiết để đảm bảo việc sử dụng đạo đức của các thuật toán dự đoán. Dữ liệu huấn luyện không đại diện tốt có thể giới thiệu các thành phần thiên vị vào các thuật toán được huấn luyện bằng MLm. “Thiên vị” là một thuật ngữ phức tạp, với ít nhất hai nguyên mẫu phổ biến trong dữ liệu y tế. Trường hợp đầu tiên là trường hợp dữ liệu nguồn không phản ánh sự dịch tễ học thực sự trong một tầng dân cư cụ thể, như trong dữ liệu dân số bị thiên vị bởi sự chẩn đoán quá mức của tâm thần phân liệt ở người Mỹ gốc Phi [8]. Trường hợp thứ hai là trường hợp một thuật toán được huấn luyện trên một tập dữ liệu không chứa đủ thành viên của một tầng dân cư cụ thể – ví dụ, một thuật toán được huấn luyện chủ yếu trên dữ liệu từ những người đàn ông da trắng già. Một thuật toán như vậy sẽ dự đoán kém, ví dụ, đối với phụ nữ da đen trẻ tuổi. Nếu các thuật toán được huấn luyện trên các tập dữ liệu có những đặc điểm này được áp dụng trong lĩnh vực chăm sóc sức khỏe, chúng có tiềm năng làm trầm trọng thêm sự bất bình đẳng về sức khỏe [9].
Để tránh rơi vào hố này, các hội khoa học và cơ quan quy định phải phát triển các quy tắc tốt nhất để nhận ra và giảm thiểu tác động tiếp theo của các tập dữ liệu huấn luyện thiên vị, trong khi các tổ chức như hội đồng xem xét viện trợ, ủy ban xét duyệt đạo đức và tổ chức đánh giá công nghệ sức khỏe phải kiểm tra việc tuân thủ các tiêu chuẩn như vậy. Là một ví dụ về cơ hội để giảm thiểu rủi ro của các thuật toán thiên vị, Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ (FDA) đã bắt đầu một chương trình thử nghiệm chứng nhận trước để đánh giá phần mềm y tế đang được phát triển dựa trên năm tiêu chí xuất sắc, bao gồm chất lượng [10]. Để tránh những tổn hại từ các tập dữ liệu huấn luyện thiên vị, tiêu chí chất lượng của FDA và các tiêu chuẩn quy định khác có thể được mở rộng để bao gồm rủi ro thiên vị trong các tập dữ liệu huấn luyện. Nhu cầu này đang được đáp ứng trong một số vòng tròn; ví dụ, các khuyến nghị chính sách về trí tuệ nghị nguyên của Hiệp hội Y học Mỹ (AMA) về trí tuệ nhân tạo (trong trường hợp này là “trí tuệ bổ sung”) khuyến khích việc xác định và giảm thiểu thiên vị trong dữ liệu [11]. Một phương pháp khác, ví dụ bởi nhóm nghiên cứu y học chính xác của Tất cả chúng ta ở Mỹ, là tài trợ cho việc phát triển các tập dữ liệu đại diện hơn có thể được sử dụng cho huấn luyện và xác minh [12].
Ngoài các biện pháp phòng vệ quy định chống thiên vị thuật toán, cần có sự phê chuẩn quy định hiện đại – dưới dạng hướng dẫn tạm thời – để đảm bảo an toàn và hiệu quả của các thuật toán dựa trên MLm. Các thuật toán này trong nguyên lý có thể được cải thiện liên tục với mỗi lần sử dụng, dẫn đến “cập nhật” theo thời gian thực không thể thử nghiệm cá nhân trong các thử nghiệm lâm sàng hoặc đánh giá theo tiêu chuẩn thời gian thông thường của một cơ quan quy định chăm sóc sức khỏe. Các cơ quan quy định phải phát triển các quy trình tiêu chuẩn bao gồm cơ chế giám sát sau thị trường hiệu quả, qua đó các nhà phát triển có thể minh bạch ghi lại sự tiến hóa của phần mềm MLm của họ.
Đọc thêm về FO4VN ─ Đội hình Chiến thuật FO4 ─ Tra cứu cầu thủ FO4