微信扫码
添加专属顾问
我要投稿
什么是视觉AI测试?
视觉测试可以理解为功能测试的一种特殊形式。通过视觉测试,断言等方式检测被测试应用或系统UI的视觉变化。而这些视觉AI解决方案可以使用视觉人工智能(Visual AI)来发现像缺失元素、扭曲布局和重叠文本这样的漏洞,这些问题常常被传统的自动化技术所忽视。本文以AI视觉测试解决方案applitools为载体进行讲解
Applitools是如何工作的?
测试是交互加上验证。测试用例步骤仅仅是进行操作并确保其正常工作的过程。在传统的断言中,测试通常需要从页面中抓取元素,然后验证元素属性,如文本值或可见性。一个测试需要多次调用来检查不同的元素。不幸的是,元素选择器可能很难编写,并且在页面更改时容易中断。它们也无法捕捉页面的所有视觉方面,如布局、颜色、大小和位置。
视觉快照是一种更为全面、稳健的测试UI的方法。与编写多个冗长的断言相比,你只需编写一行代码调用,就可以捕获页面上的所有内容的视觉快照。快照不仅仅是静态图像:它捕捉了组成页面的所有HTML、CSS和JavaScript。
视觉测试只是使用视觉快照进行断言的测试。Applitools提供了用于多种测试工具和框架(如Selenium、Cypress和Playwright)的Eyes SDK,用于捕获视觉快照。第一次运行测试时,Applitools Eyes会将初始快照作为基准图像上传到云端。然后,每次再次运行测试时,Applitools会捕获一个新的快照,称为检查点图像,并在云端使用视觉人工智能检测任何有意义的差异。
实际案例演示
本文将以Python+Selenium+Applitools Eyes SDK进行演示视觉AI测试。以Applitools官方提供的代码库为基础进行演示。步骤如下:
首先需要注册Applitools账号,账号注册完成后,会自动分配一个API key. 注册账号地址为:https://auth.applitools.com/users/register
可以从如下截图处获取API Key,(API key会在后续的步骤中使用)。
打开Github代码库:https://github.com/applitools/example-selenium-python-pytest
克隆代码到本地,并进入到项目主目录。
准备Python开发环境,最好是虚拟环境。
准备好最新版本的Chrome浏览器,并下载适配的chrome driver.
安装需要的Python类库,通过如下命令:
pip install -r requirements.txt
设置个人账号的API Key. 文件在conftest.py
可以通过执行如下命令,执行测试。
python3 -m pytest -s -v tests
测试完成后,会在控制台有如下的日志。
测试完成之后,可以通过点击控制台上的see details里面的链接进入到applitools eye捕获到的测试细节,特别是对UI的捕捉的细节。具体如下图:
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-05-27
Dolphin-API:字节Dolphin多模态文档解析模型API化全攻略
2025-05-26
本地AI对话神奇,ChatWise到底有什么用?
2025-05-25
从BGE到 CLIP,从文本到多模态,Embedding 模型选型终极指南
2025-05-25
AI Agent到底哪家强?横评五款主流Agent
2025-05-24
AI Agent协议A2A交互细节详解
2025-05-23
技术思考:小尺寸+两阶段式多模态文档解析模型Dolphin思路评析及PP-OCRv5更新
2025-05-22
Alivia VLM:企业级视觉智能体在门店场景落地实战
2025-05-21
Gemini接管搜索、全家桶秒变通用Agent ,以及Google Glass is so back!|直击Google I/O
2024-09-12
2024-06-14
2024-06-17
2024-08-06
2024-08-30
2024-05-30
2024-11-28
2024-10-07
2024-10-16
2024-04-21