如何调用mac系统自带的"实况文本"功能?

目前有个需求。需要分析出整个网页是否存在指定"关键字"。原本想通过html直接来匹配,但发现有些关键字是以图片来显示。
目前的想法是通过截屏整个网页,然后用ocr把转成文本文字再进行匹配。像先尝试用mac系统自带的“实况文本”来ocr转文字。那么好像除了用swift之外,还有其他什么方法来调用这个自带的功能吗?
如果不行,除了用Python之外,还有什么其他的好用的方案吗?

直接搜索就行,Safari 可以把网页图片里的文字搜出来,我第一次搜到的时候也很惊讶