发布到Facebook和Instagram的每张图片都由图像分析AI生成标题,而该AI变得更加智能。改进后的系统应适合视障用户,并可以在将来帮助您更快地找到照片。

替代文字是图像元数据中描述其内容的字段:“一个人站在马场上,或”一只狗在船上。” 这样可以使看不见图像的人理解该图像。
这些描述通常是由摄影师或出版物手动添加的,但是将照片上传到社交媒体的人通常不会打扰,即使他们可以选择。因此,相对较新的自动生成功能-该技术在最近几年才刚刚变得足够好-极大地有助于使社交媒体更易于访问。
Facebook于2016年创建了其自动Alt Text系统,该系统在机器学习领域是无与伦比的。此后,团队对它进行了许多改进,使其变得更快,更详细,并且最新更新添加了一个选项,可以根据需要生成更详细的描述。
改进后的系统可以识别的项目和概念比开始时多了10倍,现在大约是1200。并且描述包括更多细节。曾经的“两个人在建筑物旁”现在可能是“两个人在埃菲尔铁塔旁的自拍照”。(实际描述中使用“可能是……”进行套期保值,并且将避免包含大量猜测。)
但是,即使它并不总是相关的,但还有更多细节。例如,在此图像中,AI记录了人和物体的相对位置:
显然,人们在鼓之上,而帽子在人们之上,对于要获得要旨的人来说,确实不需要说什么。但是考虑一下描述为“一所房屋,一些树木和一座山”的图像。房子在山上还是在山的前面?树木是在房子的前面还是后面,还是在远处的山上?
为了充分描述图像,即使可以用较少的字眼理解一般想法,也应填写这些细节。如果有视力的人想要更多细节,则可以更仔细地查看或单击图像以获取更大的版本-无法执行此操作的人现在可以通过“生成详细图像描述”命令使用类似的选项。(通过长按Android应用程序或在iOS中执行自定义操作来激活它。)
也许新的描述可能是“山上有雪的房子和树木”。那画得更好,对吗?(显然,这些示例是虚构的,但这是可以预期的改进。)
新的详细描述功能将首先在Facebook上进行测试,尽管改进后的词汇将很快出现在Instagram上。说明也保持简单,因此可以轻松将其翻译为应用程序已支持的其他语言,尽管该功能可能不会同时在其他国家/地区推出。