随着直播的兴起,游戏已经从一种类似玩具的消费产品发展成为一个合法的平台和媒体,本身就具有娱乐和竞争的权利。
自 2014 年被亚马逊收购以来,仅 Twitch 的观众群就从 250,000 名平均并发观众增加到超过 300 万。 Facebook Gaming 和 YouTube Live 等竞争对手也遵循类似的轨迹。
随着当今专业流媒体将技术推向极限,以增加其内容的生产价值并自动化视频制作周期的重复部分,收视率的激增推动了支持产品的生态系统。
在线流媒体游戏是一项艰巨的任务,全职创作者每天都要进行 8 小时甚至 12 小时的表演。为了吸引宝贵的观众注意力,24 小时马拉松直播也并不少见。
然而,在相机和键盘前的这些时间只是流媒体工作的一半。保持在社交媒体和 YouTube 上的持续存在推动了流媒体频道的增长,并吸引了更多观众观看直播,他们可以购买每月订阅、捐赠和观看广告。
从 8 小时或更长时间的原始视频中提取最有影响力的 5 到 10 分钟内容成为一项重要的时间承诺。在食物链的顶端,最大的主播可以聘请视频编辑和社交媒体经理团队来处理这部分工作,但成长中的兼职主播很难找到时间自己做这件事或想出钱来外包。一天中没有足够的时间来仔细查看其他生活和工作优先事项之上的所有镜头。
游戏UI的计算机视觉分析
一种新兴的解决方案是使用自动化工具来识别较长广播中的关键时刻。几家初创公司竞相主宰这个新兴的利基市场。他们解决这个问题的方法的差异是相互竞争的解决方案的不同之处。其中许多方法遵循经典的计算机科学硬件与软件二分法。
Athenascope是首批大规模执行此概念的公司之一。在 250 万美元的风险投资资金和令人印象深刻的硅谷大型科技校友团队的支持下,Athenascope 开发了一种计算机视觉系统来识别较长录音中的精彩片段。
原则上,它与自动驾驶汽车的操作方式没有太大区别,但该工具不是使用摄像头读取附近的路标和交通灯,而是捕捉游戏玩家的屏幕并识别游戏用户界面中的指示器,这些指示器会传达正在发生的重要事件——游戏:杀戮和死亡,进球和扑救,输赢。
这些是传统上告知游戏玩家游戏中发生的事情的相同视觉提示。在现代游戏 UI 中,这些信息是高对比度、清晰和无遮挡的,并且通常始终位于屏幕上可预测的固定位置。这种可预测性和清晰度非常适合计算机视觉技术,例如光学字符识别 (OCR)——从图像中读取文本。