Các quy tắc sử dụng các dịch vụ AI cho công việc.

Tổng quan

Trong những năm gần đây, nhiều dịch vụ AI tạo sinh đã xuất hiện, và khả năng sử dụng chúng một cách hiệu quả tác động đáng kể đến sự phát triển của công ty và hoạt động kinh doanh của chúng ta. Mặt khác, có những lưu ý nhất định về việc xử lý dữ liệu khi sử dụng các dịch vụ này, được tóm tắt ở đây.

Tài liệu này tóm tắt các hướng dẫn sử dụng các dịch vụ AI ở hiện tại. Ngoài ra, các hướng dẫn này sẽ được cập nhật linh hoạt để thích ứng với những thay đổi trong công nghệ và điều kiện dịch vụ.

Hướng dẫn chung

Đây là những điểm cần được tuân thủ phổ biến khi sử dụng các dịch vụ AI tạo sinh, bất kể dịch vụ cụ thể là gì.

Về nguyên tắc, các dịch vụ AI sử dụng trong dự án cần được APPROVED bởi công ty hoặc thông báo với công ty.
- Tất cả các dịch vụ được công ty cung cấp, chỉ có thể được truy cập từ địa chỉ IP văn phòng, VPN công ty và một số địa chỉ IP cố định được cấp phép truy cập (ví dụ như server công ty, v.v.).
Khi sử dụng thông tin nội bộ hoặc thông tin bảo mật làm dữ liệu đầu vào cho AI, hãy đảm bảo rằng dữ liệu không được sử dụng để đào tạo và không được cung cấp cho bên thứ ba. Bằng cách hãy xác nhận điều này được nêu trong điều khoản sử dụng hoặc hợp đồng sử dụng dịch vụ.
- Có thể bỏ qua việc kiểm tra này nếu chỉ dùng các dữ liệu CÔNG KHAI khi làm việc với AI.
Khi nhập dữ liệu chứa thông tin cá nhân hoặc dữ liệu cá nhân, hãy đảm bảo rằng nhà cung cấp dịch vụ không "xử lý" dữ liệu đã nhập.
- Mục đích là để đảm bảo rằng nó không thuộc trường hợp "cung cấp cho bên thứ ba" hoặc "thuê ngoài" theo Luật Bảo vệ Dữ liệu Cá nhân. (Tham khảo FAQ)
- Về cơ bản, yêu cầu bạn xác nhận điều này trong các điều khoản sử dụng hoặc hợp đồng, nhưng việc giải thích "không xử lý" là một lĩnh vực mà ngay cả các chuyên gia cũng có ý kiến khác nhau, vì vậy vui lòng tham khảo ý kiến của công ty nếu bạn không chắc chắn.
- Tuy nhiên, ngay cả khi việc nhập thông tin cá nhân/dữ liệu cá nhân được cho phép khi chỉ xét riêng dịch vụ AI tạo sinh, có thể có những trường hợp cần hạn chế dữ liệu đầu vào khi xem xét mức độ bảo mật tổng thể của dịch vụ sử dụng.
Tuyệt đối không nhập Thông tin cá nhân nhạy cảm trong bất kỳ trường hợp nào.
Đảm bảo rằng quyền đối với dữ liệu đầu ra thuộc về công ty.
- Vui lòng xác nhận điều này được nêu trong các điều khoản sử dụng hoặc hợp đồng dịch vụ của họ.
Không tin tưởng mù quáng vào kết quả đầu ra của AI tạo sinh; luôn xem xét nội dung về độ chính xác, tính hợp lệ, tính nhất quán, v.v.
Khi sử dụng đầu ra của AI làm tài liệu để đánh giá hoặc hỗ trợ liên quan đến con người hoặc những nhiệm vụ quan trọng, luôn thực hiện dưới sự quyết định cuối cùng của con người.
Theo các hướng dẫn về bảo mật trong tài liệu này, mọi người vẫn có thể dùng các phiên bản AI chatbot miễn phí hoặc tự trả phí phổ biến như ChatGPT, Gemini, Grok bên cạnh các công cụ AI được công ty cung cấp và khuyến khích sử dụng.

Hướng dẫn sử dụng OpenAI (ChatGPT, OpenAI API)

Việc nhập thông tin nội bộ và thông tin bảo mật có thể thực hiện được nếu sử dụng API hoặc nếu tính năng từ chối đào tạo, từ chối thu thập thông tin được bật.
- Khi sử dụng API, By default, OpenAI will not use data submitted by customers via our API to train OpenAI models or improve OpenAI’s service offering, nghĩa là dữ liệu đầu vào không được sử dụng để đào tạo.
- Mặt khác, nếu không sử dụng API, nó nêu We may use Content from Services other than our API (“Non-API Content”) to help develop and improve our Services. You can read more here about how Non-API Content may be used to improve model performance. If you do not want your Non-API Content used to improve Services, you can opt out by filling out this form., nghĩa là nó được sử dụng để đào tạo theo mặc định.
- Bạn có thể từ chối đào tạo từ cài đặt của ứng dụng.
Về nguyên tắc an toàn, khuyến khích không nhập các thông tin cá nhân và thông tin cá nhân nhạy cảm.
- Như đã nêu trong policy OpenAI retains API data for 30 days for abuse and misuse monitoring purposes. A limited number of authorized OpenAI employees, as well as specialized third-party contractors that are subject to confidentiality and security obligations, can access this data solely to investigate and verify suspected abuse., có khả năng dữ liệu có thể được truy cập để điều tra lạm dụng trong cả hai trường hợp. Do đó, điều này có thể được hiểu là "thuê ngoài" hoặc "cung cấp" thông tin cá nhân.

Hướng dẫn sử dụng Azure OpenAI Service

Azure OpenAI Service là một dịch vụ cho phép bạn sử dụng các mô hình LLM của OpenAI (GPT) thông qua Microsoft Azure.
Không giống như OpenAI gốc, dữ liệu đầu vào không được sử dụng để đào tạo theo mặc định, vì vậy việc nhập thông tin nội bộ và thông tin bảo mật là có thể.
Ngoài ra nếu ứng dụng từ chối giám sát dữ liệu đầu vào đã được chấp thuận, việc nhập thông tin cá nhân/dữ liệu cá nhân là có thể.

Hướng dẫn sử dụng Amazon Bedrock

Amazon Bedrock là một dịch vụ cho phép bạn sử dụng các mô hình LLM như Amazon Nova và Claude.
Nó được nêu rõ ràng rằng dữ liệu đầu vào không được sử dụng để đào tạo, vì vậy việc nhập thông tin nội bộ và thông tin bảo mật là có thể.
Mặc dù có cơ chế Phát hiện các từ ngữ Nhạy cảm, nhưng được tự động hóa và được nêu rõ ràng rằng con người không truy cập dữ liệu này, vì vậy việc nhập thông tin cá nhân/dữ liệu cá nhân là có thể.

Hướng dẫn sử dụng GitHub Models

Đối với nguyên mẫu với các mô hình AI, Github có nói If you want to develop a generative AI application, you can use GitHub Models to find and experiment with AI models for free. Once you are ready to bring your application to production, you can switch to a token from a paid Azure account. See the Azure AI documentation., cho thấy nó hiện chỉ dành cho mục đích tạo prototype.
Do đó, hiện tại, không nhập thông tin nội bộ, thông tin bảo mật, thông tin cá nhân hoặc thông tin cá nhân nhạy cảm.

Hướng dẫn sử dụng Gemini for Google Workspace / NotebookLM

Gemini for Google Workspace / NotebookLM là các dịch vụ AI tạo sinh có sẵn trong Google Workspace.
Nó được nêu rõ ràng rằng dữ liệu đầu vào không được sử dụng để đào tạo, vì vậy việc nhập thông tin nội bộ và thông tin bảo mật là có thể.
Mặc dù có cơ chế Phát hiện Lạm dụng, nó được tự động hóa và được nêu rõ ràng rằng con người không truy cập dữ liệu, vì vậy việc nhập thông tin cá nhân/dữ liệu cá nhân là có thể.

Hướng dẫn sử dụng GitHub Copilot

Sử dụng GitHub Copilot for Business, không phải GitHub Copilot for Individuals.
- GitHub Copilot for Individuals được nêu là thu thập và lưu giữ dữ liệu Đoạn Mã.
- GitHub Copilot for Business được nêu là không lưu giữ dữ liệu Đoạn Mã.
Về nguyên tắc, nó có thể được sử dụng rộng rãi để viết mã, tạo tài liệu và tạo các trường hợp kiểm thử cho cả sản phẩm nội bộ và bên ngoài.
Hiện tại công ty chưa cung cấp gói Github Copilot for Business, thành viên đang dùng gói Individuals phải lưu ý:
- Tách các nội dung bảo mật / secret vào một file lưu trữ riêng như (.env, config.json)
- Chặn quyền truy cập của Copilot vào các file này theo hướng dẫn ở đây. https://docs.github.com/en/copilot/how-tos/content-exclusion/excluding-content-from-github-copilot#configuring-content-exclusion-for-your-repository
Nếu bạn nhận thấy mã được tạo ra từ AI vi phạm bản quyền hoặc giấy phép mã nguồn mở, hãy báo với trưởng nhóm và cùng nhau kiểm chứng lại việc sử dụng các đoạn mã này.

Hướng dẫn sử dụng Cline

Cline là một plugin của VS Code hỗ trợ viết mã.
Người dùng có thể chọn từ các mô hình AI tạo sinh khác nhau, nhưng về nguyên tắc, vui lòng chọn từ các nguồn sau (do công ty cung cấp key truy cập):
- AWS Bedrock
- Azure OpenAI
- Google Gemini
Nếu sử dụng AWS Bedrock, nó tuân thủ các hướng dẫn của Amazon Bedrock.
Xem xét mục đích của một công cụ hỗ trợ viết mã, sự cần thiết của việc nhập thông tin cá nhân/dữ liệu cá nhân được đánh giá là thấp, vì vậy vui lòng đảm bảo rằng các tệp chứa thông tin đó được bỏ qua. (Thêm các file này vào .clineignore)
Từ góc độ quản lý rủi ro, tuyệt đối không sử dụng các bản Fork của Cline (ví dụ: Roo Cline).

Hướng dẫn sử dụng Cursor và các công cụ tương tự

Vì công ty chưa hỗ trợ sử dụng Cursor for Business, nên mọi người có thể tự sử dụng gói cá nhân với các lưu ý sau.

Bật chế độ Privacy Mode để Cursor không track lại thông tin. (https://www.instructa.ai/blog/cursor-ai/how-to-keep-your-code-private-with-cursor-ai)
Các file không nên được nhập vào mô hình AI có thể được chỉ định trong .gitignore và .cursorignore
Chính sách hoạt động của các mô hình AI được Cursor sử dụng nội bộ không rõ ràng, và xét mục đích của một công cụ hỗ trợ viết mã, vì vậy vui lòng đảm bảo rằng các tệp chứa thông tin bảo mật, riêng tư và nhạy cảm phải được bỏ qua.