@OrayDev Organization
by OrayDev
引导 AI 视觉模型识别桌面截图中的 UI 元素位置并返回归一化坐标。当需要分析屏幕截图、定位界面元素(按钮、输入框、图标、菜单等)并获取归一化位置坐标时使用。接收图片路径,理解用户意图,输出归一化坐标 (x_norm, y_norm),范围 [0.0, 1.0]。