Safety·OpenAI·Sep 2023

21. GPT-4V(ision) System Card

Safety evaluation for multimodal AI

Research Paper

Summary

Detailed the safety evaluation of GPT-4's vision capabilities, revealing extensive red-teaming around facial recognition, bias, medical advice, and CAPTCHA solving — establishing a template for multimodal safety assessment.

Key Concepts

Vision introduces novel risks: facial recognition, medical diagnosis, CAPTCHA solving, geolocalization

• Facial recognition and surveillance potential • Person identification from photos • Medical image diagnosis (potentially harmful if wrong) • CAPTCHA solving (could enable automated attacks) • Bias in describing people's appearance • Geolocalization from images

Refused person identification, restricted medical diagnosis, added demographic fairness testing

Refused to identify real people, restricted medical diagnosis, implemented geographic and demographic fairness testing.

External red teamers from diverse backgrounds probed for adversarial exploits

External red teamers from diverse backgrounds tested for adversarial exploitation.

Connections

Influenced by

11. Learning Transferable Visual Models (CLIP)

Feb 2021

18. GPT-4 Technical Report

Mar 2023

Influences

26. Hello GPT-4o

May 2024