搜索 AI Search Rules & Tips
1. 遵守中国大陆相关法律法规
2. 请勿滥用 AI 答案作为跟帖
3. 推荐:Free ChatGPT List
4. AI 作品:〈云游博物馆〉

网络谜踪:雨天的阅读角,ChatGPT 地理识别一例

查看: 3469|回复: 7
CloseAI 发表于 2024-7-22 16:56:07
image-42.webp

照片来自:corner for rainy day reads

一个引起强烈舒适的场景。看到 Reddit 讨论区中有问 "What city is this?" 随即调动 ChatGPT 询问一番。回答可谓优秀,对话复制如下:

🗣 [上图]
这是哪个城市?

这张照片拍摄的城市是费城(Philadelphia),位于美国宾夕法尼亚州。从窗外的建筑和景观可以看出,这是费城的一部分,特别是费城博物馆区附近的景象。

照片中可以看到费城市中心的建筑,尤其是那座带有金色十字架的圆顶建筑,这可能是费城的一个著名地标,如费城市政厅(Philadelphia City Hall)的尖顶。再加上窗外的雨景和街道布局,这些都表明这是费城的一部分景观。


🗣 带有金色十字架的圆顶建筑是?

照片中带有金色十字架的圆顶建筑是费城圣彼得圣保罗大教堂(Cathedral Basilica of Saints Peter and Paul)。这座教堂是费城天主教总教区的主教座堂,位于本杰明·富兰克林公园大道(Benjamin Franklin Parkway)上,是费城最著名的宗教建筑之一。其特色的铜绿色圆顶和金色十字架使其在城市天际线上非常显眼。


🗣 这张照片的拍摄者大概位于什么位置?哪栋建筑?

从照片中的视角和位置来看,拍摄者应该位于费城罗根广场(Logan Square)附近的一个高层建筑中。从照片中可以看到费城圣彼得圣保罗大教堂的圆顶及其周围的景象,这表明拍摄者的视角是从大教堂的东南方向拍摄的。

根据这一视角,拍摄者很可能位于以下两栋建筑中的一栋:

1. The Logan Philadelphia, Curio Collection by Hilton:这是罗根广场附近的一家高档酒店,位于大教堂的正对面。它的房间和露台提供了极佳的视野,可以俯瞰大教堂及其周围区域。

2. The Windsor Suites:这是一栋高层公寓楼,也位于大教堂附近,具有类似的视野。

综合来看,最有可能的是拍摄者位于 The Logan Philadelphia 酒店的一间房间中,因为从照片中的角度来看,它更符合这一位置的视角。


🗣 有没有可能位于 One Cathedral Square?(就在 ChatGPT 回答中的酒店旁边)

是的,很有可能拍摄者位于 One Cathedral Square。One Cathedral Square 是一栋新的高层住宅楼,位于费城圣彼得圣保罗大教堂的东南侧,提供了直接俯瞰大教堂及其周围景象的视野。从照片中的角度和高度来看,这种可能性是非常高的。


snipaste_20240722_162800.webp
 楼主| CloseAI 发表于 2024-7-22 17:07:16
My first thought was soviet vibes. It’s the weather, architecture and what resembles an Orthodox Church.

I just glanced at this and was thinking Eastern Europe. Would not have guessed Philadelphia. That bed looks so comfy.

借这两条评论来说,如果单凭一些建筑知识和印象来粗略判断,就很难跟美国的城市关联上,所以这题 ChatGPT 还是见功力的。
moreye 发表于 2024-7-22 19:27:37
除非找不到唯一性,这图拿到手第一原则肯定是识图,还不会直接上升到知识和逻辑判断的角度。
 楼主| CloseAI 发表于 2024-7-23 09:10:12
moreye 发表于 2024-7-22 19:27
除非找不到唯一性,这图拿到手第一原则肯定是识图,还不会直接上升到知识和逻辑判断的角度。 ...

看看照片的发布时间吧,非联网的 ChatGPT 所做的判断就是基于照片中可见的地标识别和已有的知识。

AI 识图早已不单是传统的特征提取匹配,现在数据和算力都不是问题,力大砖飞,导致所提取的抽象特征(本例中的圆顶 & 金色十字架 & 街道格局)鲁棒性(本例中窗户上雨珠即一种扰动参数)更强,由此结合自身知识储备进行泛化的能力也在提升,甚至有初阶逻辑推理(本例中的方位描述)。事实上,GPT 目前正在接近其绘制的 5 步走蓝图的第二阶段——推理 - Reasoners -高级的逻辑推理(人类专家水平)。
moreye 发表于 2024-7-23 12:55:39
CloseAI 发表于 2024-7-23 09:10
看看照片的发布时间吧,非联网的 ChatGPT 所做的判断就是基于照片中可见的地标识别和已有的知识。

AI 识 ...

gpt只是号称不联网,并不是真不联网。
虽然很牛,但目前我觉得仍很一般,你把原图剔除圆顶和金十字架,你再让gpt通过街景和街道识别下图片看看能不能识别地址,但人是可以的。
 楼主| CloseAI 发表于 2024-7-23 13:15:48
moreye 发表于 2024-7-23 12:55
gpt只是号称不联网,并不是真不联网。
虽然很牛,但目前我觉得仍很一般,你把原图剔除圆顶和金十字架,你 ...

gpt 只是号称不联网,并不是真不联网。——何以见得?信源?

虽然很牛,但目前我觉得仍很一般,——这句有点废话文学的味道。

你把原图剔除圆顶和金十字架,你再让 gpt 通过街景和街道识别下图片看看能不能识别地址,但人是可以的。——我还知道 FBI 如果愿意,即便把教堂甚至窗外都马赛克了,人还能快速查询联系到拍照的人,从而获知地址呢。技术革新是来解放生产力的,朋友。
moreye 发表于 2024-7-23 14:20:11
1、能不能连网你可以问问他自己,他会告诉你
2、牛是从你的角度说的,我觉得一般
3、第三部分是我感受不到他是通过逻辑判断找到的地址位置,如果就是圆顶+十字架感觉和识图没区别,所以我才会测试没有圆顶+十字架的部分,大概我用的是免费版,我这边上传同样的图GPT无法识别具体位置。
 楼主| CloseAI 发表于 2024-7-23 15:42:41
moreye 发表于 2024-7-23 14:20
1、能不能连网你可以问问他自己,他会告诉你
2、牛是从你的角度说的,我觉得一般
3、第三部分是我感受不到 ...

OpenAI 官方发布的信息来说:联网版本限 Plus 和 Enterprise 用户。至于现在是否已面向所有用户开放,我没看到相关信息。

牛或者一般都只是观点,不重要。真正有价值的是支持观点的论证,GPT 展示了我认为见功力的回答 ,但是没看到你有相关实质性论证,比如你的最佳实践、所需的时间成本。

回到本例,接上文对话的提问:你是通过联网获取的信息吗?

不是的,我没有通过联网获取信息。我的判断是基于对照片中可见地标的识别和已有的知识。

1. 视角和高度:照片显示了俯瞰费城圣彼得圣保罗大教堂的视角,这表明拍摄地点位于高层建筑的某一高度。

2. 附近建筑的地理知识:了解费城圣彼得圣保罗大教堂周围的建筑布局和高层建筑的位置,如 One Cathedral Square、The Logan Philadelphia 酒店和 The Windsor Suites。

3. 判断逻辑:通过对这些高层建筑的相对位置和高度进行推断,确定哪些建筑更有可能提供这种视角。

结合这些因素,得出拍摄者可能位于 One Cathedral Square 的结论。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

虫部落 陕ICP备14001577号-1川公网安备 51019002003015号联系我们FAQ关于虫部落免责声明虫部落生存法则社区广场RSS

Build with for "make search easier" Copyright © 2013-2025. Powered by Discuz! GMT+8, 2025-5-2 08:21

快速回复 返回顶部 返回列表