Perplexity推出了更好的手机助手,但只能用于安卓

Perplexity推出了更好的手机助手,但只能用于安卓


Perplexity推出了手机版的AI Assistant,仅限于安卓(当然,苹果手机上权限受限)。

是的,比OpenAI有诚意得多。

只要在手机里设置一下“助手”对应的APP,就可以通过从屏幕左下角划屏到屏幕中央,调用助手,虽然做不到hand-free,不过也算不错了。

AI Assistant Settings

Perplexity有一点做的是不错的,就是语音对话时,会在屏幕上显示AI语音对应的文字,这点对于我们这样非英语母语的人而言是极其友好的,用助手的同时创造了一个自由且实用的语言环境。

我逐项测试了Perplexity导航里的功能,因为涉及到个人隐私,截图都使用Perplexity的示例,我直接讲使用结果和感受。

功能1:播放歌曲。

Play Music

开发团队是有多喜欢《Interstellar》或者汉斯·季默(当然我也季度喜欢汉斯·季默,尤其是在London’s Temple Church录管风琴的那段,极度震撼,打岔了)?

我试的结果是,助手默认只会打开Spotify,要求我登录,即使我没有安装Spotify,即使我要求打开的是“Apple Music”,结果都是Spotify。

这清楚的说明了一点,Perplexity Assistant只是调用了预设好的程序的API,而不是点开手机上的APP(操作系统也不会给这样的权限的,即使是安卓)。

以上是我昨天测试时的结论。然而,我突然发现Spotify藏在了一个角落,没有发现。然而当我删掉Spotify时,小惊喜出现了。

App Selection

程序让我指定调用的APP,我毫不犹豫选择了Apple Music,然后成功了。

所以:Perplexity Assistant可以打开APP,但是打开后,就无法进行进一步操作了。除非一开始就“布置好”任务。

功能2:提醒功能

Reminders

这个功能运行得很正常。当然,Gemini也早就有了。不过,个人认为Perplexity的这种确认结果的小卡片是很“审美在线”的。

功能3:信息和邮件编写

Messaging

这个功能测试运转正常。不过,我总觉得哪里不对劲,哦,对了,我们打开Message或者微信,发一段语音,其实操作起来也不麻烦的。信息是人与人的沟通,中间加一个AI,有点多此一举的感觉。

功能4:导航

Navigation

这是我觉得最好用的功能。不过还是那句话,凡是要用到Google原生功能的,Gemini都已经做掉了。

功能5:提醒的摘要

Notification Summary

对手机的所有提醒进行摘要,这个功能其实很好。不过有个小问题,因为不堪各种无良APP的乱推送,我有关掉每一个APP的提醒功能的强迫症。

功能6:“屏幕共享”?

Screen Context

我想不出Screen Context的好的中文翻译。这个功能其实在桌面端更有用,因为最佳的场景就是不断跟随着屏幕的变化来承担“助手”的职能(不妨试试Google的AI Studio利用Gemini2.0实时分享屏幕对话的极度丝滑体验)。如今只能看静态屏幕的话,总有种多此一举的感觉,不如三星手机利用Google的“Circle to Search”(三星手机的这个功能非常非常好)。

功能7:问摄像头

Camera Question

这大概是AI助手营销最多的“案例”。最早出现在Rabbit R1这个硬件上,然后出现在ChatGPT里,后来,Gemini也有了,如今 Perplexity也跟上了。但是,这个功能我不知道该如何评价,我如今只有一个很实际的场景:路上经过一些有趣的地方,但是我没带“严肃的拍摄设备”,那就拍一张照片,记录一下机位。但是我其实更需要的是直接帮我整理好加进“未完成机位列表”的文档里。我想,如果助手做到这种多步的程度,可能才称得上有用吧。

功能8:订餐;功能9:电话

Ordering

Phone Calls

我越来越觉得“点外卖”、“订餐厅”这种任务对我这样的人而言,其实不想要AI干预的,过程会更有意思点。打电话,同理。当然,如果下次,助手可以自动跟对面的“AI客服”沟通并解决问题,那就有用了。

功能10:动作链

Action Chains

多步调用,跨服务和模态调用肯定是绝大多数助手功能的前提。只是,在目前只能调用三方服务API的前提下,这个功能依然不那么好用。

以上评价,我也做一下调整:可以调用APP,但是因为无法保持跟用户的实时交流,所以用户友好度一般。

总结:仅就Perplexity推出的这些功能和技术层面的完整性及努力而言,我可以给到一个很高的分。相比之下,OpenAI最近干的事情就一件比一件“掉价”了。

可是,打高分,难掩一个尴尬的现实:AI Agent真的那么令人激动吗?

首先,从手机这个形态而言,AI助手功能就只会是苹果和Google的自留地,Perplexity再努力也无法获得手机的超级权限,但是操作系统可以。其实,上面的这些功能技术上实现根本不难,只是任何创业公司的探索,可能都是在为两大巨头做嫁衣,提供素材而已;

其次,如果AI Agent真的在很多方面提高了我们的效率,那么上面的很多功能,我们可能反而希望“手搓屏幕”实现了。人性很奇怪的。

我真的认为,模型厂商和这些兼有应用和模型的厂商,真的应该去怼AI硬件,不要跟手机较劲了。

AI硬件

道明,公众号:道明数字游牧生活

ChatGPT“助手”功能发布后:OpenAI与Agent之间差一个硬件

最后,无论是OpenAI的Operator,还是Perplexity的Assistant,很多功能其实都是依靠开一个Sandbox的虚拟环境来模拟人类操作实现的。

那直接集成到一个硬件里,摆脱手机的束缚,不好吗?

← Back to Blog