文 | 太平洋科技
再坚持一把,胜利就在前方!现在坚守在工位的科仔心里这么想着,眼睛却又时不时被 live 朋友圈和抖音里已经开始美妙国庆假的朋友们所吸引。
可是放假就在眼前,旅游攻略还没做好,身为 J 人的科仔心里也是焦急万分。正在这时,突然发现一个好伙伴可以帮我在工作摸鱼之际快速做旅游攻略的好搭子,他就是——AI 聊天机器人。
于是,科仔将要对目前市面上最火的几款 AI 聊天机器人进行一个大测评,被选中的选手有:Kimi、字节豆包、百度文小言和腾讯元宝。
本次比赛中,科仔将会在以上的各个 AI 聊天机器人中输入相同的「需求」,并且全是基于 ” 白嫖 ” 的最基础版本。
此次的需求是:”请帮我策划一次一个人四天三晚的从广州至长沙的国庆旅行,总预算 4500 元,希望是非特种兵式旅行,可以轻松一点,但是要去几个大型景点,需要给出酒店和餐厅的建议。“
并且,科仔将从旅游可行度、预算使用程度和与「prompt」符合程度几个角度来判断各个参赛者的得分。为了更加贴合旅游目的地的实际情况,科仔还邀请了一位 ” 老长沙人 ” 小 W 同学来协助评判。
话不多说,比赛,开始!
Kimi
在输入需求之后,Kimi 显示查询了 29 个网页,并且 ” 不假思索 ” 地给出了他的旅行计划。
从旅游可行性角度来说,老长沙人小 W 认为,整体还是比较 OK 的。比如在景点选择上,四天三晚只安排了 4 个大景点,有考虑旅行的景点密度及旅行强度。
在餐厅选择上,Kimi 也的确选择了比较具有代表性的两个餐厅。在预算上也是非常节省,加上餐饮和交通的话应该也只会需要 4000 左右。
But,小 W 同学锐评到:” 我四天就吃两家店?” 好像确实只有第一天,Kimi 给出了准确的餐厅推荐,随后三天都没有给出具体的餐厅,而是画了一个片区让游客自行 ” 觅食 “,甚至第二天和第三天的中午得在车上度过,让人联想到了 ” 散养式 ” 旅行团,在旅游的逻辑链条上存在明显缺陷。
小 W 同学还指出,「需求」只要求了餐厅和酒店,Kimi 就只给出了餐厅的选择,而忽略了长沙具有代表性的奶茶业和米粉,联想和拓展能力一般。
字节豆包
字节豆包的思考过程较长,在经过大约 5 秒左右的思考和中间短暂的 ” 卡壳 ” 之后,也给出了他的答案。
从旅行合理程度而言,豆包和 Kimi 给出了近乎相同的安排,在四天三晚的旅行中加入了三个区域的景点规划,并且安排了半天的自由活动时间。
并且在表述上,豆包还非常细节地指出了这些景点中的特点和避雷点。比如强调了坡子街和太平老街的风格类似、爱晚亭的季节性枫叶以及湖南省博物馆需要提前 7 天预定门票等。这些信息都是在旅行过程中非常细节和重要的因素。在餐厅的选择和推荐上,小 W 同学认为豆包给出了比 Kimi 更加细节且更地道的长沙小馆,是 ” 不踩雷 ” 好推荐了~
然而,豆包必然不是完美的,和 Kimi 一样,豆包的安排也是分为上午 – 中午 – 下午 – 晚上四个时间范围,但是并不是每一天都有四个安排,而是偶尔没有中午、偶尔没有晚上,让整个旅游线路逻辑性存疑。
除此之外,被小 W 同学一顿吐槽的当属预算安排。豆包同学没有在行程安排中给出详细的预算,乍一看好像万事无忧。但是鹰眼小 W 同学被这份安排吓了一条,豆包推荐了长沙知名的奢华酒店,小 W 同学对此吐槽道 ” 如果按这个预算,只有一晚能睡酒店,其余时间可能要睡在大街上了~”
腾讯元宝
下一位迎战的同学是来自企鹅家的腾讯元宝。
” 不愧是企鹅,网感很不错 “,小 W 对元宝的回答如此评价到。
首先是元宝的数据库中查询到了「橘子洲国庆节烟花」这一特殊事件,并将这一特殊事件安排在了精力最充足的第二天,这样才会有最充足的时间和精力在橘子洲周边的人潮中奋战。
除此之外,元宝不仅注意到了目前长沙最 ” 网红 ” 的产品之一 ” 茶颜悦色 “,还在餐饮的选择上也贴近了年轻人和 ” 打卡 ” 的需求。在兼顾这些要素的同时,也没有遗漏长沙经典的那些景点。
在旅游逻辑上,元宝在第一天仅给出了机酒及晚餐的推荐,相当于是自由活动,算是强调了「非特种兵」的需求。而在第二天和第三天都给出了上午、中午、下午和晚上四个时间节点的安排,几乎是安顿好了旅行者的方方面面。
要是硬说不足的话,可能是没有给出在博物馆和岳麓山附近的具体餐厅的推荐,在这些大景区附近选餐厅不是一件容易的事~
文小言
老牌 AI 文小言压轴登场,也是交出了一份与他的 ” 资历 ” 相符合的答卷~
作为四份旅游攻略中最详细的一份,文小言无论是在内容准确度、逻辑性及预算控制上,都展现出了比较强的能力。
首先是线路设计上,在到达日给出了非常细节的安排,包括了「夜游」设计中从傍晚开始的细节安排。第二天和第三天也是给出了上午 – 中午 – 下午 – 晚餐 – 晚上五个时间节点的细节安排,比元宝更加细节。
在内容选择上,基础的景点设置包揽了长沙的著名景点属于是 ” 无功无过 “。但是文小言除了讲述简单的景点选择之外,还提示了交通建议和游览建议,比如建议搭乘地铁前往橘子洲,橘子洲的游览小火车价格如何以及橘子洲上的关键景点。同样是推荐橘子洲,文小言的这份攻略就更加有可行性,游客甚至可以 ” 无脑跟随 “,不需要任何其他攻略辅助。
预算上,文小言也是非常合理地罗列了所有的费用安排,并且在预算内完成了这份旅游攻略。
只是,在餐厅的选择上,成也资历,败也资历,小 W 同学不留情面的指出文小言的餐厅选择有点偏 ” 老成 ” 且都比较贵,应该不会是年轻人喜欢的类型。
不过依然瑕不掩瑜,这份攻略值得非常高的评价。
打分环节
Kimi:旅游逻辑链条缺失 -15 分;旅游内容不够有吸引力 -10 分,最终得分 75 分~
豆包:旅游逻辑链条缺失 -15 分;旅游内容推荐没有契合「需求」-20 分,最终得分 65 分~
腾讯元宝:旅游内容少量缺失:-10 分,最终得分 90 分~
文小言:相较之下比较完美,旅游内容略 ” 老气 “-5 分,最终得分 95 分~
整体来看,其实四位参赛的 AI 同学都理解了「需求」的内容,并且在内容选择上或多或少做了契合「需求」的努力。只是从对比来看,元宝和文小言的内容更加像一个 ” 人 ” 给出来的建议。
元宝就像看了几十个小红书帖子就洋洋洒洒开始写东西的年轻人,给出许多 ” 网红 ” 或是 ” 热门 ” 的推荐,却在吃饭睡觉上少量 ” 失误 “,可能是企鹅打心里认为人就有 ” 自主能动性 “。
文小言的建议则是更像一个普普通通的打工族 J 人,事无巨细地规划出坐地铁到哪一站下车、学生票比成人票便宜多少钱等等。”该省省,该花花,共享单车去酒吧~” 小 W 是这么评价文小言的策划的。
不过一句话总结,如果你是一整个旅行团中唯一的那位策划者,那么 AI 同学们的确能够帮你省下不少时间,他们给出的旅游逻辑可以让你在短时间内决定大框架,从而减少没有针对性的 ” 无的放矢 “。
但是!如果一整个旅行团都是 P 人,想要通过 AI 完全替代旅行策划,建议还是不要,因为毕竟你也不想第二天一餐饭都吃不到,最后被迫去路的拐角吃麦麦吧~