0%

ChatGPT 安卓端产品分析报告

ChatGpt分析报告 -By 曹越洋

作者姓名:曹越洋
所属院校:香港大学数据与系统工程系
联系方式:andy.caoyueyang[at]gmail[dot]com
报告完成日期:2025年1月15日

摘要

本报告深入分析了OpenAI公司开发的ChatGPT安卓端应用,旨在评估其在移动场景下的功能特性、用户需求和市场竞争力。
研究发现,自ChatGPT 发布以来,生成式AI 技术在全球范围内引发了广泛关注,其安卓移动端应用则进一步满足了用户在碎片化时间内的即时需求。
本报告通过实际体验、数据收集和竞品对比等多种方法,系统地分析了ChatGPT 安卓版的核心功能、用户画像、使用场景、优缺点以及市场表现。研究结果表明,ChatGPT 安卓版凭借强大的内容生成能力、多平台协同和多模态输入等优势,吸引了大量用户。
然而,该应用在移动端仍然面临诸多挑战,包括网络连接不稳定、信息准确性不足、功能细节有待完善等问题。通过对用户需求的深入分析,本报告总结出用户对更准确、可靠的信息、更佳的用户体验和更强大的多功能性提出了迫切需求。
此外,本研究还对 ChatGPT 安卓版进行了 SWOT 分析,并结合实际问题提出了相应的优化建议和未来发展策略,为产品的优化和推广提供了参考。这些建议主要包括性能优化、功能增强、用户体验优化、商业化探索和生态建设等方面。本报告强调,为保持 ChatGPT 在移动端市场的竞争优势,应着重提升产品的信息准确性和可靠性,加强用户体验细节,并在垂直领域提供更加专业的服务。

关键词: ChatGPT, 生成式 AI, 移动应用, 用户需求分析, 竞品分析, 产品优化

一、背景分析

自从2022年11月30日OpenAI公司发布ChatGPT (Chat Generative Pre-trained Transformer )以来,人工智能成为了全球关注的焦点。
根据UBS的报告,ChatGPT的用户数在发布仅两个月内便突破了一亿人,成为史上用户增长最快的消费级互联网应用(Bhaimiya, 2023)。
随着两年来生成式AI(Generative AI)的迅速发展,ChatGPT的模型已经从最初的GPT-3.5发展到GPT-o3。其强大的对话能力和信息处理能力在多个领域引发了深远影响。
ChatGPT已经成为一个现象级别的人工智能应用,在人机交互领域带来了前所未有的变革。从内容生成到自然语言理解,生成式AI工具的应用场景日益丰富,ChatGPT逐渐成为用户获取信息、提升效率的首选工具。
然而,随着智能手机的普及和信息需求的激增,用户在移动端使用AI工具时仍然面临以下问题:

  • 信息过载:面对海量的信息资源,用户难以快速找到所需内容,传统搜索工具的效率逐渐显得不足。
  • 效率需求:在日常生活和工作中,用户需要快速生成高质量文本、整理复杂信息或进行语言翻译,但这些需求在移动端仍难以高效满足。
  • 碎片化时间的利用:用户希望利用零散的时间完成更多任务,但现有工具往往操作繁琐,无法快速响应。
    为了解决这些痛点,OpenAI在2023年5月18日和7月25日分别推出了ChatGPT的iOS和Android版本,使得用户能够随时随地通过手机端体验AI助手的便捷功能。ChatGPT移动端不仅提供了强大的文本生成能力,还兼具多任务处理、对话辅助等特性,成为集聊天机器人、信息检索工具和对话伙伴于一身的口袋助手。
    然而,如何进一步优化ChatGPT在移动端的使用体验,使其更好地适应碎片化场景中的高效需求,仍是值得探讨的问题。
    本报告将围绕ChatGPT安卓端的功能特性、用户需求与市场竞争等方面展开分析,以期为产品的优化和推广提供参考。

1.1 产品简介

ChatGPT安卓端是OpenAI开发的一款基于生成式AI技术的聊天机器人,旨在为用户提供便捷、高效的交互体验。作为ChatGPT模型的移动端应用,它将生成式AI的强大功能融入日常生活和工作场景,帮助用户随时随地解决问题、生成内容并提升效率。
核心功能包括:

  1. 文本生成:ChatGPT可以根据用户的输入快速生成高质量的文本内容,包括撰写文案、编写邮件等。
  2. 多模态输入:支持语音、图像、视频、文档输入功能,用户可以通过语音或者共享摄像头提问,提供了丰富的交互方式选择。
  3. 上下文理解:基于强大的上下文理解能力,能够记住对话的前后逻辑,提供更自然、流畅的对话体验。
  4. 多语言支持:支持多语言交流,用户可以用不同语言输入问题并获得准确的回答,适用于翻译和跨语言交流。
  5. 个性化功能:用户可以通过“对话历史记录”随时查看过去的聊天内容,便于延续讨论或记录信息,同时ChatGPT独有“记忆”功能,能够在交互中记住用户的关键信息,在后续的全局提问中提供个性化的反馈。

1.2 分析目标和报告范围

随着生成式AI技术的快速发展,ChatGPT已成为行业领先的人工智能产品,其安卓移动端进一步满足了用户在碎片化场景中的即时需求。本报告旨在通过对ChatGPT安卓端的功能特性、用户需求和市场竞争的全面分析,探讨其在移动端场景中的优势与不足,为产品优化和推广提供参考依据。
本报告主要聚焦以下几个方面:

  1. 产品功能分析:评估ChatGPT安卓端的核心功能及用户体验。
  2. 用户需求分析:探讨其用户群体的主要使用场景及痛点。
  3. 竞争环境分析:对比市场上主要AI聊天机器人的移动端表现,找出ChatGPT的差异化优势。
  4. 优化建议:结合现有问题提出改进方案,为提升产品市场竞争力提供建议。

二、方法与环境说明

2.1 体验环境

体验版本:Android版ChatGPT 1.2024.352
体验设备:一加Ace2
安卓版本:14
体验时间:2024.12
编辑目的:了解ChatGPT的产品功能、产品特性、产品表现

2.2 分析方法

本报告采用以下三种方法对ChatGPT安卓端进行系统分析,以确保结论的全面性与客观性:

  1. 实际体验
    通过亲自使用ChatGPT安卓端,深度体验其核心功能,包括文本生成、语音输入、对话上下文理解、历史记录访问等。同时,将其在不同场景下的使用效果(如学习、办公、创意写作)进行评估,以发现产品的优势与不足。体验过程中重点关注以下维度:
  • 功能完整性:核心功能是否符合预期,能否满足用户的基本需求。
  • 用户体验:界面设计是否友好,操作是否便捷。
  • 性能表现:响应速度、稳定性等关键指标。
  1. 数据收集
    基于公开渠道收集与ChatGPT安卓端相关的市场数据和用户反馈,主要来源包括:
  • 市场数据:通过Google Play、Reddit等平台获取ChatGPT相关讨论、ChatGPT安卓端的下载量、月独立设备数及实时排名等指标,分析其市场表现。
  • 用户评论:收集Google Play评论中的用户反馈,提炼用户对产品功能、使用体验的优缺点评价。
  • 行业报告:参考Statista、Data.ai等第三方报告,了解生成式AI行业在移动端的整体发展趋势。
  1. 竞品对比
    选择ChatGPT的两款主要竞品(Google Gemini和豆包AI助手)进行对比分析,重点从以下几个方面评估三款产品的表现差异:
  • 核心功能:如文本生成质量、语音输入的准确性、对话上下文理解能力等。
  • 用户体验:界面设计、操作便捷性、功能集成度。
  • 市场表现:下载量、活跃用户数、用户评价。
    通过上述方法,本报告旨在全面呈现ChatGPT安卓端的功能表现、用户需求契合度以及与竞品的差异化优势,最终为产品优化和推广策略提供数据支持和方向指引。

三、产品简介

3.1 产品概括与定位

3.1.1 产品概括

ChatGPT安卓端是由OpenAI开发的一款基于生成式AI技术的智能助手,依托先进的大语言模型(如GPT-4o),能够通过自然语言交互为用户提供高效、精准的服务。

3.1.2 产品定位

  1. 功能定位
    ChatGPT不仅是一个聊天机器人,更是一个“口袋助手”,结合了以下多种功能定位:
  • 知识引擎:帮助用户快速搜索信息和解决复杂问题。
  • 效率工具:支持内容生成、翻译、总结等,提高工作和学习效率。
  • 创意伙伴:在创意写作、内容策划等方面,提供灵感和具体建议。
  • 情感陪伴:作为一款对话式助手,帮助用户缓解孤独感或进行轻松互动。
  1. 用户群体定位
    虽然ChatGPT的用户群体广泛,但可以根据使用场景和需求大致分为两类:
  • 普通用户:以个人为单位,使用场景包括学习(如问题解答、文档生成)、日常娱乐(如对话陪伴)和生活辅助(如行程规划、问题咨询)。
  • 企业用户:以公司或组织为单位,使用ChatGPT进行客户支持、内容营销、企业内部流程优化(如文档整理、自动化生成)等。
    通过覆盖多样化的功能和用户场景,ChatGPT安卓端将自己定位为一个全能型的智能助手,特别适合需要快速解决问题或利用碎片化时间提升效率的用户群体。

3.2 用户需求分析

使用Python中的praw库,使用ChatGPT辅助编写爬虫程序,爬取了三个Reddit问题下面的来自全球用户的“你用ChatGPT来做什么”相关问题的讨论。(Reddit, 2023a; Reddit, 2023b; Reddit, 2024)。
提取得到包含时间戳、用户、评论内容的1116条数据的CSV文件后,首先对提取的数据进行清洗,把内容分成了低于8个词的207条和高于8个词的909条评论。
对于质量较低的207条评论,把它们整合到txt文档中,用Google Ai Lab的Gemini 2.0 Flash Experimental模型进行分析,分析用户可能的用途。
对于909条评论,调用火山引擎的Doubao-pro-4k、Doubao-pro-32k、Doubao-pro-128k模型,对提取的评论进行逐条分析,得到包含“用途、画像、优点、缺点、需求”在内的五列数据的CSV文档。
接着把五列内容每一列单独提取合并到每条对应的单独的txt文本文档中,上传到Google Ai Lab的Gemini 2.0 Flash Experimental模型逐个进行分析,得到每个数据对应的标签结果,最后对这些数据进行统计作图。
具体的工作流程如下流程图所示:

数据分析工作流程图
使用Google Gemini 2.0 Flash Experimental模型的原因:根据Chatbot Arena(一个盲测大模型功能进行评分的平台)数据显示,Gemini 2.0 Flash Experimental排行第四,而且实际使用来看具有不错的反应速度,因此选择此模型进行最后的分析。
不直接把爬取后的原始的数据直接发给大模型进行处理的原因:实际也进行了尝试,但是发现即便是Google Gemini 2.0 Flash Experimental模型对于直接发过去给出的回复也非常有限,会忽略掉评论里面有价值的内容,因此选择逐条进行分析提取数据后再用大模型分析以此,最后用Excel进行数据统计,以此能够得到更加准确的数据。

3.2.1 GPT用途

对爬取的评论数据进行分析,将评论里面提到的使用Chatgpt的场景进行分类,可以大致分为以下11个类型。

  1. 编程/开发辅助 (Coding/Development Assistance):
    定义:指的是使用 ChatGPT 来辅助软件开发、编程、脚本编写等相关的活动。
    包含: 代码编写、代码调试、代码解释、代码生成、代码优化、学习编程、API 使用、自动化脚本等。
  2. 学习/教育 (Learning/Education):
    定义:指的是使用 ChatGPT 来辅助学习、获取知识、进行教育培训等相关的活动。
    包含: 课程学习、作业辅导、概念解释、考试准备、学习计划制定、语言学习、知识拓展等。
  3. 内容创作 (Content Creation):
    定义:指的是使用 ChatGPT 来生成各种形式的原创内容,包括文字、图片等。
    包含: 博客文章、小说/故事、诗歌、剧本、歌词、营销文案、社交媒体帖子、网站内容等。
  4. 办公/效率提升 (Work/Productivity):
    定义:指的是使用 ChatGPT 来辅助日常工作、提高办公效率的活动。
    包含: 邮件撰写/润色、文档处理、会议纪要、报告生成、数据分析/处理、表格处理、项目管理、计划制定、商业案例研究、沟通辅助等。
  5. 信息查询/研究 (Information Retrieval/Research):
    定义:指的是使用 ChatGPT 来获取信息、进行研究、探索知识等相关活动。
    包含: 快速搜索信息、事实核查、数据查找、文献查询、概念解释、获取特定领域的知识等。
  6. 娱乐/休闲 (Entertainment/Leisure):
    定义:指的是使用 ChatGPT 来进行娱乐、消遣、放松、享受乐趣等相关的活动。
    包含: 角色扮演、游戏辅助(包括DND)、创意写作(如搞笑故事)、谜语/游戏、听歌/看电影推荐、消遣对话、与 AI 对话消磨时间等。
  7. 情感/心理支持 (Emotional/Psychological Support):
    定义:指的是使用 ChatGPT 来获得情感上的支持、心理上的慰藉、以及自我反思和情绪管理等相关的活动。
    包含: 倾诉、寻求安慰、自我反思、心理咨询、情感陪伴、获得鼓励和激励等。
  8. 日常助手/生活管理 (Daily Assistant/Life Management):
    定义:指的是使用 ChatGPT 来辅助日常生活、进行个人管理、规划、安排等相关的活动。
    包含: 膳食计划、健康管理、旅行规划、日程安排、购物清单、家庭管理等。
  9. 翻译/语言处理 (Translation/Language Processing):
    定义: 指的是使用 ChatGPT 来进行语言之间的转换、以及对语言进行理解、润色、优化等相关的活动。
    包含: 文本翻译、语言学习辅助、语言风格润色、语法检查等。
  10. 其他 (Others):
    定义:此分类为兜底分类,用于归类那些无法明确归入其他11个分类中的用途。
    包含: 无法归入以上类别的其他用途。它主要用于收集那些用途不明确、非常独特、混合难以拆分或与主要类别无关的评论。通过这个分类,可以更全面地了解 ChatGPT 的使用情况,同时也为发现新的使用模式留出了空间。
  11. 未知/不明确 (Unknown/Unclear):
    定义:此分类为兜底分类,用于归类那些完全无法确定用户在使用 ChatGPT 做什么的评论。
    包含: 无法明确用途的评论,如用户只是表达了困惑或未提供具体使用场景。它用于归类那些完全无法判断用户在使用 ChatGPT 做什么的情况。与 “其他” 分类相比,”未知/不明确” 类别的信息量更少,通常是因为评论本身过于简略、含糊不清,或者只是表达疑问或看法,没有提及任何实际的用途。
    数据和分析
    对1116条数据进行全量计次的方法统计的用途分类,即将每条评论中提到的多个用途都单独计算权重进行数据统计,得到的数据如下表所示。
用途分类(全量计次) 用途数量(全量计次) 比例
编程/开发辅助 252 12.81%
学习/教育 208 10.57%
内容创作 143 7.27%
办公/效率提升 415 21.10%
信息查询/研究 190 9.66%
娱乐/休闲 124 6.30%
情感/心理支持 33 1.68%
日常助手/生活管理 143 7.27%
翻译/语言处理 34 1.73%
其他 226 11.49%
未知/不明确 199 10.12%
总和 1967 100.00%

移除其他和不明确的数据分类后,得到的图表如下

用途分类(全量计次) 用途数量(全量计次) 比例
编程/开发辅助 252 16.34%
学习/教育 208 13.49%
内容创作 143 9.27%
办公/效率提升 415 26.91%
信息查询/研究 190 12.32%
娱乐/休闲 124 8.04%
情感/心理支持 33 2.14%
日常助手/生活管理 143 9.27%
翻译/语言处理 34 2.20%
总和 1542 100.00%


GPT用途分布柱状图

对这些数据进行分析
主要结论:

  • 办公/效率提升是核心用途 (26.91%): 在明确的使用场景中,办公和提高效率是用户使用 ChatGPT 的首要目的,占比远高于其他类别。这强调了 ChatGPT 作为职场和生产力工具的价值。
  • 编程/开发辅助和学习/教育并列成为重要应用 (16.34% 和 13.49%): 在明确用途的用户中,技术开发和教育学习的需求非常显著,两者占比接近,表明 ChatGPT 在技术和知识领域有强大的吸引力。
  • 信息查询/研究保持较高比例 (12.32%):信息获取和研究是用户使用 ChatGPT 的重要动因,体现了其作为信息源的价值。
  • 内容创作和日常助手/生活管理处于同一水平 (9.27% 各自): 在明确用途的用户中,内容创作和日常生活辅助的需求相当,表明 ChatGPT 在创意支持和生活管理方面也有一定的应用。
    次要结论:
  • 娱乐/休闲占比相对稳定 (8.04%): 即使排除了不明确的用途,依然有一部分用户将 ChatGPT 用于娱乐目的。
  • 情感/心理支持和翻译/语言处理占比仍然较低 (2.14% 和 2.20%): 这可能反映了用户更倾向于使用专业工具或真人服务来满足这些需求,或者 ChatGPT 在这些领域的应用还不够普及,或者智能化程度还不够。

3.2.2 用户画像

对909条高质量数据进行人物画像分析,可以把评论的用户大致分为以下8个类型。
1.学生 (Student): 包括大学生、高中生、研究生、医学生等。
2.技术开发者 (Programmer/Developer): 包括前端、后端、全栈、游戏开发者、软件工程师、IT 顾问、网络工程师、数据分析师、DevOps等。
3.职场人士 (Professional): 包括教师、医生、律师、销售、市场营销、人力资源、经理、分析师、行政人员等。
4.内容创作者 (Content Creator): 包括作家、编剧、博主、记者、YouTuber、视频创作者、文案撰写人、游戏创作者等。
5.教育/科研人员 (Educator): 包括科研人员、博士生、研究生、教师、辅导人员、大学管理人员等。
6.普通用户 (General User): 使用 ChatGPT 等 AI 工具,但没有明确的、突出的职业、学习、或兴趣标签的用户。他们的使用场景通常是日常生活中的各种需求,例如信息查询、娱乐、获取建议、解决简单问题等。包括需要信息、娱乐、解决问题、学习语言等的普通互联网用户。
7.其他 (Other): 不符合主要用户身份分类标准,或者身份属性较为复杂、难以归入单一类别,身份特征不够典型,跨越多个领域,或者具有一些特殊属性的用户,例如特殊病症患者、特定学习或职业目标用户。包括自由职业者、个体经营者、健身爱好者、美食爱好者等
8.身份不明确 (Unclear): 身份或背景信息不足。
数据和分析
由于207条低质量数据有效信息过少,后续的用户画像和优缺点分析都剔除了这部分数据,现在对909条高质量数据进行用户画像分析,采用唯一计次即一条评论只占单一权重的方式进行统计。

用户画像 用户数量 比例
技术开发从业者 153 16.83%
教育/科研人员 30 3.30%
内容创作者 73 8.03%
学生 72 7.92%
职场人士 85 9.35%
普通用户 135 14.85%
其他 260 28.60%
身份不明确 101 11.11%
总和 909 100.00%
剔除身份不明的数据,以及把”其他”分类和普通用户数据进行合并之后,得到新的表格如下所示。
用户画像 用户数量 比例
技术开发从业者 153 18.94%
教育/科研人员 30 3.71%
内容创作者 73 9.03%
学生 72 8.91%
职场人士 85 10.52%
普通用户 395 48.89%
总和 808 100.00%


用户画像人口统计图

对这些数据进行分析
主要结论:

  • 普通用户是绝对主力 (48.89%): 接近一半的用户属于“普通用户”类别,这表明 ChatGPT 的应用的易用性和通用性吸引了大量非专业用户,也说明的可能大部分用户目前仅仅用Chatgpt作为一个搜索引擎的替代品。
  • 技术开发从业者是重要的专业用户群体 (18.94%): 技术开发人员是第二大用户群体,这与之前分析的编程/开发辅助是重要用途的结论相符,再次印证了 ChatGPT 在技术领域的价值和吸引力。
  • 职场人士构成显著的用户群体 (10.52%): 职场人士的占比也超过 10%, 这与之前分析的办公/效率提升是主要用途的结论相呼应,说明 ChatGPT 已经成为许多职场人士提升效率的工具。
    次要结论:
  • 内容创作者和学生占比接近 (9.03% 和 8.91%): 虽然占比低于前三类,但内容创作者和学生都是重要的用户群体,表明 ChatGPT 在内容生成和教育学习方面也具有相当的吸引力。
  • 教育/科研人员占比相对较低 (3.71%): 相对于学生群体,教育/科研人员的占比显得较低,这可能值得进一步探讨,例如是否是该群体更倾向于使用其他专业工具,或者 ChatGPT 的某些功能尚未充分满足其需求,当然最主要的原因可能来自于数据本身是Reddit社区,存在系统性的样本偏差。

3.2.3 优缺点总结

优点
对用户评论中明确提到的优点进行全量计次统计,一共得到740条有效数据(剔除385条空白数据),可以分为8个大类。

  • 强大的创造力和灵感激发:ChatGPT 被广泛赞誉为创意工具,可以帮助用户拓展想象力,激发写作灵感,提供新的创意起点。

  • 高效的信息检索和问题解答:用户认为 ChatGPT 能够快速提供信息和答案,节省在搜索引擎上花费的时间,规避广告干扰,并能提供较为精准的搜索结果。

  • 多用途的应用场景:用户发现在多个领域都可以使用 ChatGPT, 包括但不限于写作、编程、教育、商业、娱乐和生活。

  • 强大的文本生成能力:ChatGPT 可以帮助用户撰写邮件、报告、论文、故事、诗歌和代码,并能根据用户的具体需求进行内容调整。

  • 辅助学习和知识理解:ChatGPT 可以帮助用户理解复杂的概念、解析法律术语、提供课程大纲,并以耐心友好的方式进行教学。

  • 编程辅助:ChatGPT 可以生成代码,提供调试建议,帮助用户学习新的编程语言和框架,并且可以加速开发过程。

  • 用户体验良好:用户普遍认为 ChatGPT 使用方便,界面友好,能够快速响应用户的需求,并能以多种形式提供帮助。

  • 节省时间:大量用户提及chatgpt节省了他们大量的时间,提升了他们的工作效率。
    优点数据和分析

    优点(全量计次) 数量 比例
    编程辅助 72 9.73%
    多用途的应用场景 118 15.95%
    辅助学习和知识理解 91 12.30%
    高效的信息检索和问题解答 97 13.11%
    节省时间 39 5.27%
    强大的创造力和灵感激发 35 4.73%
    强大的文本生成能力 81 10.95%
    用户体验良好 207 27.97%
    总和 740 100.00%


优缺点分析汇总图

主要结论(按数据占比排序):

  • 用户体验良好是最大的亮点 (27.97%): 超过四分之一的用户认为 ChatGPT 的用户体验非常好。这对于产品的普及和用户留存至关重要。
  • 多用途的应用场景受到高度认可 (15.95%): 近 16% 的用户赞赏 ChatGPT 的多功能性,认为它在写作、编程、教育、商业、娱乐和生活等多个领域都有应用价值。这说明 ChatGPT 的通用性是其一个显著的优势。
  • 高效的信息检索和问题解答是关键优势 (13.11%): 超过 13% 的用户肯定了 ChatGPT 在信息获取方面的效率,认为它能快速提供信息和答案,节省时间,并提供相对精准的结果,避免了搜索引擎的广告干扰。这体现了 ChatGPT 作为知识助手和信息源的价值。
  • 辅助学习和知识理解是重要应用 (12.30%): 超过 12% 的用户认为 ChatGPT 在学习方面有很大帮助,能够理解复杂概念、解析术语、提供课程大纲等,并且教学方式耐心友好。这突显了 ChatGPT 在教育领域的潜力。
  • 强大的文本生成能力受到普遍认可 (10.95%): 近 11% 的用户赞赏 ChatGPT 的文本生成能力,认为它可以撰写各种类型的文本,并能根据需求进行调整。这直接反映了 ChatGPT 作为内容创作工具的核心能力。
  • 编程辅助得到一定程度的认可 (9.73%): 近 10% 的用户肯定了 ChatGPT 在编程方面的辅助作用,包括生成代码、提供调试建议、帮助学习编程语言等。虽然不如用户体验占比高,但也显示了其在技术领域的价值。
    其他值得关注的点:
  • 节省时间是重要的实际收益 (5.27%): 虽然占比不算最高,但用户明确提到 ChatGPT 能够节省时间,提升效率,这是一个非常实际且有吸引力的优点。
  • 强大的创造力和灵感激发虽占比不高,但具有特殊价值 (4.73%): 尽管占比相对较低,但“强大的创造力和灵感激发”这一优点表明 ChatGPT 不仅是工具,还能帮助用户拓展思维,提供新的创意起点,这对于内容创作者等用户群体来说非常重要。
    缺点数据分析
    对用户评论中明确提到的缺点进行全量计次统计,一共得到191条有效数据(剔除934条空白数据),可以分为12个大类。
  • 信息不准确和幻觉问题: 用户报告说,ChatGPT 有时会提供不准确的信息,编造内容,出现幻觉,且对答案过于自信。
  • 依赖提示词: ChatGPT 的表现高度依赖于提示词的质量,需要用户有一定的知识储备和明确的引导才能获得理想的结果。
  • 知识截止和时效性问题: ChatGPT 的知识更新截止到2021年底,对之后的新发展不了解,导致提供的链接可能失效或有误,给出的信息存在时效性问题。
  • 特定领域的局限性: 在某些专业领域,ChatGPT 的知识可能不准确,且在解释复杂书籍和专业概念方面存在困难。
  • 回答的重复性和模式化: 有用户反映,ChatGPT 对相同问题可能会给出相同的答案,回答方式也比较模式化,不能稳定按照要求回复。
  • 代码质量参差不齐: ChatGPT 生成的代码可能存在错误,漏洞和需要进一步调试,不能完全依赖。
  • 用户可能产生依赖: 有用户担心会过度依赖ChatGPT,影响独立思考和学习能力
  • 安全隐患: 用户担心在数据安全方面存在隐患,且生成的内容可能存在版权问题。
  • 部分场景效果不佳: 在某些场景,如数学、翻译、图像生成、总结等,ChatGPT 的表现可能不如预期。
  • 缺乏情感和个性: 在表现人类情感和创造个性化内容方面,ChatGPT 存在一定困难。
  • 特定问题无法回答: 部分用户指出,在特定问题,如寻找非常具体的事实、特定网站、或者需要最新信息的时候,ChatGPT的表现不如搜索引擎。
  • 用户体验方面存在部分问题: 包括交互不够高效,编辑后会产生错乱,无法代码复制粘贴,消息回复数量限制。
    缺点数据和分析
    缺点(全量计次) 数量 比例
    安全隐患 8 4.19%
    部分场景效果不佳 17 8.90%
    代码质量参差不齐 22 11.52%
    回答的重复性和模式化 13 6.81%
    缺乏情感和个性 11 5.76%
    特定领域的局限性 16 8.38%
    特定问题无法回答 7 3.66%
    信息不准确和幻觉问题 50 26.18%
    依赖提示词 7 3.66%
    用户可能产生依赖 6 3.14%
    用户体验方面存在部分问题 28 14.66%
    知识截止和时效性问题 6 3.14%
    总和 191 100.00%

主要结论(按比例排序):

  • 信息不准确和幻觉问题是最受关注的缺点 (26.18%):这无疑是 ChatGPT 最严重的问题之一,直接影响其可靠性和可信度。这也解释了为何描述中将其列为首位,并强调了其自信的错误。
  • 用户体验方面存在部分问题是第二大槽点 (14.66%):这表明尽管 ChatGPT 的用户体验整体评价较高,但在细节方面仍有改进空间。
  • 代码质量参差不齐是技术用户的痛点 (11.52%): 这对于将其用于编程辅助的用户来说是一个重要的限制,表明不能完全信任其生成的代码。
  • 部分场景效果不佳是实际应用中的不足 (8.90%):这揭示了 ChatGPT 在通用性方面仍然存在局限,需要在特定任务上进行优化。
  • 特定领域的局限性限制了专业应用 (8.38%): 这限制了其在专业领域的应用深度,也呼应了描述中提到的解释复杂书籍的困难。
  • 回答的重复性和模式化影响交互体验 (6.81%): 这降低了交互的灵活性和个性化程度。
  • 缺乏情感和个性限制了情感交流 (5.76%): 这限制了其在情感交流和创意内容生成方面的能力。
    其他值得关注的缺点:
  • 安全隐患 (4.19%)、特定问题无法回答 (3.66%)、依赖提示词 (3.66%)、用户可能产生依赖 (3.14%)、知识截止和时效性问题 (3.14%): 虽然这些缺点的占比相对较低,但仍然代表了用户的一些重要担忧和局限性认知。 例如,安全隐患关乎数据安全和版权问题,依赖提示词则提高了用户的使用门槛。

结论
结合优缺点和重要性排序的实际需求:

  • 更准确、可靠的信息: 这是最迫切的需求。用户希望 ChatGPT 能够提供准确、可信赖的信息,避免编造内容和产生“幻觉”。 解决信息不准确问题是提升用户信任度的关键。
  • 更佳的用户体验: 虽然整体用户体验评价较高,但用户仍然希望在细节上获得提升,例如更流畅的交互、避免编辑错误、支持代码复制粘贴、解除回复数量限制等。
  • 更强大的多功能性和通用性: 用户认可 ChatGPT 在多个领域的应用潜力,希望它能持续拓展其应用场景,并在不同领域都能提供高质量的帮助。
    重要需求 (基于占比居中的优点和缺点):
  • 在特定领域更专业、更深入: 用户希望 ChatGPT 在专业领域能够提供更准确、更深入的知识和解答,尤其是在解释复杂概念方面。
  • 更高质量的文本生成能力: 用户希望 ChatGPT 不仅能生成文本,还能生成高质量、符合需求的文本,并减少重复和模式化的回答。
  • 更可靠的编程辅助能力: 用户希望 ChatGPT 生成的代码质量更高、更可靠,减少错误和漏洞,使其能够真正辅助开发工作。
  • 更高效的信息检索和问题解答: 用户希望 ChatGPT 能够更快速、更精准地提供信息和答案,节省搜索时间。
    因此,总结的优化方向是:优化基础模型的准确性、增强用户在细节上的体验、在垂直领域提供更加专业帮助。

3.2.4 用户需求

基于用户在909条评论中直接提到的需求和表述过程中可能的潜在需求进行统计分析分析,具体可分类如下。
1.代码生成:代码准确性

  • 描述: 此类别关注于 ChatGPT 生成代码的准确性和可靠性。用户希望生成的代码能够正确运行、逻辑无误。
  • 原始文档体现:
  • “希望ChatGPT生成的代码质量更高,减少漏洞”
  • “在编写编程代码片段时能够更加准确和可靠,减少错误和无效的函数调用”
  • “提供更准确的代码示例、针对特定问题的代码解决方案等”
    2.代码生成:高效代码辅助
  • 描述: 此类别关注于 ChatGPT 在代码编写过程中提供的效率提升帮助,例如代码示例、API指导等。
  • 原始文档体现:
  • “提供更多功能支持,如更精准的代码示例、更全面的库介绍等”
  • “在JavaScript和CSS相关方面提供更精准、详细的指导”
  • “更高效、准确地提供代码编写帮助以及清晰易懂的解释”
    3.工具优化:个性化对话
  • 描述: 此类别关注于 ChatGPT 在对话交互方面提供的个性化体验,例如模仿特定角色、提供贴近用户需求的回复。
  • 原始文档体现:
  • “可能希望ChatGPT能更生动、准确地模仿特定角色的说话风格和语气,提供更有激励性的话语”
  • “希望ChatGPT能更精准地模仿角色的语言风格和特点,提供更多有趣的谜语或互动内容”
  • “希望ChatGPT能在更多场景下提供更精准、多样化的回复和帮助,例如在模仿个性和特定场景互动中表现得更出色”
    4.工具优化:功能优化与拓展
  • 描述: 此类别关注于 ChatGPT 在现有功能基础上进行的优化和拓展,并增加新的功能。
  • 原始文档体现:
  • “希望ChatGPT能在功能上进一步完善,如具备更多API、多模态、长期记忆,实现根据照片推荐食谱、辅助治疗陪伴、帮助规划项目并生成相关内容等功能”
  • “在辅助工作和娱乐方面能有更丰富的功能和更好的表现”
  • “提供更个性化、灵活且有趣的辅助工具”
    5.工具优化:文本处理效率
  • 描述: 此类别关注于 ChatGPT 在文本处理方面的效率提升,如邮件撰写、文案润色等。
  • 原始文档体现:
  • “可能需要ChatGPT提供更高效、准确的脚本编写和沟通内容生成功能,以提升工作效率”
  • “希望ChatGPT能更高效、准确地润色工作邮件,提升英语表达的专业性和准确性”
  • “希望ChatGPT能更高效地辅助完成线上写作工作,比如提供更准确的内容生成、更高的写作效率等”
    6.工具优化:稳定性和可靠性
  • 描述: 此类别关注于 ChatGPT 运行的稳定性、可靠性、准确性,以及数据的安全性。
  • 原始文档体现:
  • “可能需要一个更稳定、准确的语言模型”
  • “希望ChatGPT能持续稳定地提供帮助,不要被停用”
  • “希望ChatGPT能够稳定保存用户的编辑进度,避免出现数据错乱丢失的情况”
    7.工具优化:用户需求分析
  • 描述: 此类别关注于用户希望 ChatGPT 的提供者能够理解用户需求、场景、习惯,从而提供更有针对性的服务。
  • 原始文档体现:
  • “了解用户工作或休闲时的具体任务,以便更好地解释如何最佳使用该工具”
  • “了解ChatGPT在处理复杂哲学概念时的难点,以便更好地理解人们在学习哲学概念时可能遇到的类似问题”
  • “了解作为老技术人员可以如何使用ChatGPT”
    8.内容生成:创意性与独特性
  • 描述: 此类别关注于 ChatGPT 生成内容的创新性、独特性和风格多样性。
  • 原始文档体现:
  • “可能希望ChatGPT能更生动、准确地模仿特定角色的说话风格和语气,提供更有激励性的话语”
  • “可能需要ChatGPT提供更多创意灵感和写作辅助功能”
  • “可能希望得到更多具有特色风格的激励性话语”
    9.内容生成:情境化与个性化
  • 描述: 此类别关注于 ChatGPT 生成的内容是否贴合特定的用户需求、情境和目标。
  • 原始文档体现:
  • “可能需要ChatGPT提供更丰富、更得体的回复话术来应对攻击性邮件”
  • “希望ChatGPT能更精准地根据需求改写邮件内容,使其在保持原意的基础上更加礼貌得体”
  • “在编写邮件时能更精准地把握客户需求和风格,提高邮件的专业性和针对性”
    10.内容生成:质量与准确性
  • 描述: 此类别关注于 ChatGPT 生成内容的质量和准确性。
  • 原始文档体现:
  • “希望ChatGPT能更高效、高质量地完成各类沟通信件的撰写”
  • “希望ChatGPT生成的文案在风格上更自然、贴合需求,避免过于商业化的风格”
  • “希望ChatGPT在生成内容时更加精准,减少离题和数学错误等问题”
    11.信息获取:深入解释与理解
  • 描述: 此类别关注于用户希望 ChatGPT 不仅提供表面信息,而是能够深入分析、解释事物的本质。
  • 原始文档体现:
  • “可能希望ChatGPT能更深入、全面地解释书籍内容,或者对更多类型的书籍进行解读”
  • “希望ChatGPT在专业知识的准确性上有所提升,能更好地解释复杂内容”
  • “希望ChatGPT能更精准、深入地解释医学相关概念和机制”
    12.信息获取:问题解决与支持
  • 描述: 此类别关注于 ChatGPT 在用户遇到问题时,能够提供有效的帮助、建议、指导和情感支持。
  • 原始文档体现:
  • “可能希望得到更多关于应对亨廷顿病的相关建议和信息”
  • “希望在遇到紧急情况时,ChatGPT能继续提供准确、实用的应对建议”
  • “获取更多在与姐姐争执场景下的有效应对策略和沟通技巧”
    13.信息获取:学习辅助功能
  • 描述: 此类别关注于 ChatGPT 在学习方面提供的辅助功能,如提供学习计划、练习题、解释知识点等。
  • 原始文档体现:
  • “可能需要ChatGPT提供更多教育相关的素材、案例,以丰富教案内容”
  • “希望ChatGPT能在学习资料整理方面提供更多帮助,比如进一步优化总结内容、生成更有针对性的抽认卡等”
  • “可能需要更有针对性的学习指导和资源,以更好地实现学习和提升的目标”
    14.信息获取:知识准确性与可靠性
  • 描述: 此类别关注于 ChatGPT 提供信息的准确性、可靠性和时效性。
  • 原始文档体现:
  • “希望ChatGPT能更精准地分析股票投资价值,提供更详细和有针对性的投资建议”
  • “希望ChatGPT能在找工作、园艺和钓鱼等方面提供更准确、详细和实用的信息”
  • “希望ChatGPT能在更多领域提供更精准、丰富的内容支持,比如进一步优化医疗诊断思路等”
    15.需求不明确
  • 描述: 此类别指的是用户反馈内容不够清晰、具体,难以归类到其他明确的类别,或者没有明显体现潜在需求的内容。
    可能的需求数据分析
    可能的需求 数量 比例
    代码生成:代码准确性 31 3.41%
    代码生成:高效代码辅助 64 7.04%
    工具优化:个性化对话 58 6.38%
    工具优化:功能优化与拓展 119 13.09%
    工具优化:文本处理效率 29 3.19%
    工具优化:稳定性和可靠性 57 6.27%
    工具优化:用户需求分析 57 6.27%
    内容生成:创意性与独特性 64 7.04%
    内容生成:情境化与个性化 93 10.23%
    内容生成:质量与准确性 77 8.47%
    信息获取:深入解释与理解 41 4.51%
    信息获取:问题解决与支持 8 0.88%
    信息获取:学习辅助功能 48 5.28%
    信息获取:知识准确性与可靠性 115 12.65%
    需求不明确 48 5.28%
    总和 909 100.00%


用户潜在需求分析图

与之前优缺点分析的关联:

  • 工具优化(35.20%)对应用户体验和通用性需求: 工具优化的需求直接呼应了之前分析中用户对更好用户体验和更强大通用性的需求,例如更稳定的服务、更个性化的交互、以及拓展更多功能。
  • 内容生成(25.74%)对应内容质量和创意需求: 内容生成的需求与用户对更高质量、更具创意和个性化的内容生成能力的期望一致。
  • 信息获取(23.32%)对应准确性和学习辅助需求: 信息获取的需求则对应了用户对信息准确性、可靠性以及学习辅助功能的期待。
  • 代码生成(10.45%)对应编程辅助需求: 代码生成的需求直接反映了用户希望 ChatGPT 能够提供更准确、更高效的编程辅助。

3.3 市场现状和分析

目前Openai的ChatGPT产品的盈利模式主要有以下几种:
1.订阅服务:
OpenAI推出了ChatGPT Plus和ChatGPT Pro等付费订阅服务,用户可通过支付月费获得更快的响应速度和优先访问等特权。然而,有报道称,尽管ChatGPT Pro每月收费200美元,但由于用户使用频率超出预期,该服务目前处于亏损状态。 (腾讯新闻, 2025)
2.API接口:
OpenAI向企业和开发者提供API服务,允许他们将ChatGPT的功能集成到自己的产品中,并根据使用量收费。这种B2B模式被认为是未来主要的收入来源之一。 (ESM China, n.d.)
3.广告收入:
OpenAI正在考虑在ChatGPT中引入广告模式,以增加收入。虽然目前尚无具体计划,但这一可能性已被提上议程。 (The Times, n.d.)
4.定制化服务:
针对特定行业或企业需求,OpenAI可能提供定制化的模型训练和解决方案,以满足不同客户的需求,从而获得收益。(The Wall Street Journal, n.d.)

3.3.1 月下载量


ChatGPT移动应用月下载量趋势(2023年5月—2024年9月,数据来源:Statista)

根据statista的数据显示从2023年5月至2024年9月,ChatGPT的移动应用下载量呈现出“快速增长-波动下降-恢复上升”的趋势。下载量在2023年11月达到峰值(约1870万次),随后有所回落,但到2024年9月重新攀升至约2357万次,显示出其强大的市场吸引力和用户基数。(Statista, n.d.)

3.3.2 实时排名


ChatGPT在Google Play北美免费榜排名历史(数据来源:Sensor Tower)
根据SensorTower的数据显示,2025年1月9日,ChatGPT应用在北美地区的GooglePlay总榜免费榜排名为第7,最近90天在5-25的范围内波动,保持较高的热度。(Sensor Tower, n.d.)

3.3.3 内购和活跃用户情况

随着GPT-4o的推出,明星级AI应用《ChatGPT》2024年5月收入环比增长43%。2024年8月收入超过4500万美元,创历史新高。2024年1-8月,《ChatGPT》吸金2.3亿美元,占AI+Chatbot赛道收入的39%。截至2024年8月,《ChatGPT》累计收入突破2.7亿美元。(Sensor Tower, 2024)
ChatGPT收入增长图
ChatGPT移动端收入增长情况(数据来源:Sensor Tower)
从活跃用户规模来看,《ChatGPT》月活跃用户数一路增长,2024年8月超过1.9亿人,是全球活跃用户规模最大的AI应用。(Sensor Tower, 2024)

ChatGPT月活跃用户增长情况(数据来源:Sensor Tower)

四、产品分析

4.1 产品结构图


ChatGPT安卓端产品结构图
从结构图可以看出:ChatGPT的结构相对简洁,核心功能在主界面就可全部设定完成,侧边栏主要为探索商店和历史记录,设计也符合手机用户使用习惯,可快速上手。

4.2 用户使用流程图

基本和主要功能类似搜索引擎,应为过于简单,此次略过

4.3 单个大模型功能分析SOP

鉴于分析单个大模型功能流程较为复杂,此处只列出SOP。
目标: 确保 LLM 在特定应用场景下,能高效、准确、可靠地满足用户需求,并持续优化。
步骤:

  1. 明确评估目标 (Why):
  • 1.1 基于应用场景定义目标:
    • 核心原则: 评估目标必须与 LLM 的实际应用场景紧密结合,例如:
      • 文本生成: 评估生成的文本是否流畅、逻辑清晰、符合特定风格、信息准确。
      • 问答系统: 评估回答的准确性、相关性、完整性、是否理解用户意图。
      • 代码生成: 评估生成的代码是否正确、可执行、高效。
      • 信息抽取: 评估抽取的信息是否准确、全面、无歧义。
    • 具体案例:
      • 电商客服 LLM: 目标可能是快速、准确地回答用户咨询,解决售后问题,提升用户满意度。
      • 内容创作 LLM: 目标可能是生成高质量的文章、脚本、广告文案,满足特定的创作需求。
  • 1.2 举例说明:
    • 例如,如果我们的目标是利用LLM生成高质量的文章,评估目标可能包括:
      • 生成的文章是否符合特定风格 (例如,新闻报道、科技评论)
      • 文章的逻辑是否清晰,结构是否完整。
      • 文章的信息是否准确,来源是否可靠。
      • 文章是否引人入胜,可读性强。
    • 另外的例子,如果我们的目标是利用LLM辅助生成代码:
      • 生成的代码是否可执行?
      • 代码是否符合最佳实践和代码规范?
      • 代码的效率和性能如何?
  1. 制定评估策略 (What):
  • 2.1 构建评估框架:
    • 核心原则: 评估框架应包含多个维度,全面衡量 LLM 的性能。
    • 评估维度:
      • 准确性/精确度: 模型输出是否符合预期,是否正确。
      • 召回率/覆盖率: 是否涵盖了所有相关的信息或答案。
      • 完整性: 回答是否全面,是否缺少重要信息。
      • 相关性: 输出是否与用户的 prompt 相关。
      • 流畅性/可读性: 生成的文本是否自然流畅,易于理解。
      • 逻辑性/连贯性: 输出的逻辑是否清晰,前后是否一致。
      • 满意度/用户体验: 用户对模型输出的整体评价。
      • 效率/性能: 模型生成结果的速度、资源消耗。
      • 安全性/伦理性: 模型输出是否包含有害、不恰当的内容。
      • 可解释性/可溯源性: 模型输出的原因是否可解释,信息来源是否可追溯。
    • 评分方法:
      • 量化指标: 准确率、召回率、F1 值、BLEU 值等。
      • 定性指标: 人工评分,例如使用 Likert 量表 (1-5 分) 衡量流畅度、逻辑性。
  • 2.2 举例说明:
    • 电商客服 LLM:
      • 指标: 回答准确率、问题解决率、用户满意度、响应时间。
      • 评分: 用户满意度可通过在线问卷或问题解决后的评分系统来获取。
    • 内容创作 LLM:
      • 指标: 内容原创性、信息准确性、可读性、是否符合目标受众的偏好。
      • 评分: 通过人工评审,并针对不同维度进行评分。
  1. 选择评估方式 (Who/How):
  • 3.1 人工评估:
    • 优点: 更能评估主观因素 (如满意度),能发现模型细微的错误或不妥之处。
    • 缺点: 耗时、成本高、容易受到主观偏见影响。
    • 应用场景: 需要评估内容质量、创造性、逻辑性,或涉及复杂判断的场景。
  • 3.2 自动化评估:
    • 优点: 效率高、成本低、可复现、不受主观因素影响。
    • 缺点: 可能无法评估主观因素,或难以捕捉复杂语义信息。
    • 应用场景: 需要快速评估大量数据,或评估客观指标 (如准确率)。
  • 3.3 混合评估:
    • 方式: 自动化评估做初步筛选和性能监控,人工评估进行深度分析和质量控制。
    • 优点: 结合两者的优势,得到更全面的评估结果。
  1. 构建评估集 (Data):
  • 4.1 数据来源:
    • 真实数据: 尽可能使用真实用户产生的数据,能更真实地反映模型的实际表现。
    • 构建数据集: 如果真实数据不足,可以构建包含多种情况和边界条件的合成数据集。
      • 合成数据集需要尽可能接近真实数据,并覆盖各种 Corner case。
      • 可以使用不同的方法 (例如,数据增强、人工标注) 构建多样化的数据集。
  • 4.2 数据集规模:
    • 数据集规模应足以覆盖评估维度,并能有效地衡量模型的性能。
    • 根据具体评估目的,合理确定数据集的大小。
  • 4.3 举例说明:
    • 电商客服 LLM: 使用历史用户咨询数据,并模拟多种常见问题场景。
    • 内容创作 LLM: 构建包含不同主题、风格的文本样本,并涵盖不同类型的文案需求。
  1. 执行评估流程 (Process):
  • 5.1 定义环节:
    • 初步评估: 快速测试模型基本功能,排除明显错误。
    • 详细评估: 针对不同维度进行深入测试,并记录数据。
    • 交叉验证: 多个团队或人员独立评估,降低评估偏见。
  • 5.2 评估团队:
    • 组建专业的评估团队,包括:
      • prompt工程师: 负责优化 prompt,提升模型效果。
      • 评估人员: 负责执行评估,记录数据,分析结果。
      • 技术人员: 负责维护评估工具,提供技术支持。
  • 5.3 沟通和协作:
    • 确保团队成员充分沟通,明确任务分工,并及时解决问题。
  1. 总结评估结果 (Analysis):
  • 6.1 数据分析:
    • 对评估数据进行分析,找出模型优缺点,并绘制图表进行可视化。
  • 6.2 复盘:
    • 模型层面:
      • 分析模型的准确率、召回率、F1 值等指标,找出模型性能瓶颈。
      • 根据评估结果,调整模型参数、优化训练数据、改进 prompt。
    • 业务层面:
      • 分析模型上线后的实际表现,如用户反馈、流量数据、转化率等。
      • 评估用户对 prompt 的接受程度,并不断迭代优化。
  • 6.3 报告撰写:
    • 撰写评估报告,总结评估过程和结果,并提出改进建议。
      (小红书, 2024),(知乎, 2024)

4.4 产品迭代路线

总结官网的更新日志发现,更新内容主要集中在:模型能力增强、多模态能力、功能和工具扩展、用户体验优化、商业化和团队合作、免费和付费用户的区分。
安卓端的更新包括:应用发布(2023年7月25日)、语音功能发布(2023年9月25日)、支持图像输入(2023年9月25日)、使用体验的改善(2024年11月22日)、语音聊天的视频和屏幕共享功能支持(2024年12月12日)。
未来从产品功能角度可以优化的内容可能有:Prompt管理、离线功能、分享功能优化。(OpenAI, 2024)

4.5 总结

当前产品凭借其强大的创造力和灵感激发、高效的信息检索能力、多用途的应用场景和强大的文本生成能力等优势,为用户节省了大量时间,并且绝大部分用户觉得体验良好。
然而,产品也面临着不少痛点:最突出的问题是连接和登录问题,以及回答质量和准确性的不足,包括信息不准确、幻觉、理解意图不足等;其次是功能缺陷和不稳定性,比如朗读功能失效,图片上传受限;此外,用户对付费限制、信息来源的偏向、代码质量参差不齐和数据安全隐私等问题也有反馈,同时,用户还期待产品能有更稳定的服务,更个性化的交互、以及在特定领域提供更专业的帮助。

五、用户意见

5.1 数据来源

使用Google Play的接口和Node.js的google-play-scraper库在2025年1月4日按照时间倒序爬取3000条数据,取其中大于15字的619条数据直接使用Google Ai Lab的Gemini 2.0 Flash Experimental逐条输出缺点并进行统计,作为安卓端实际优化的方向参考。

5.2 用户反馈的缺点归纳

采用全量计次的方式,619条评论共计提到507个缺点。可以大致分为以下几类:

  1. 连接与登录问题
  • 描述: 用户在尝试登录、连接服务器时遇到的问题,包括白屏、转圈、无法加载、提示网络错误、SSL 证书错误、设备时间错误、VPN 检测等。
  • 具体描述示例:
    • “一直白色界面转圈,进不去登录界面”
    • “登录报错时间不对或者一直重复登录无法进去对话界面”
    • “网络配置问题 ,似乎服务器使用错误的 SSL 证书进行了响应”
      2.功能缺陷与不稳定
  • 描述: 应用本身功能缺失、功能失效、性能不稳定等问题,包括朗读功能、语音功能、图片/文件上传、记忆功能、编辑功能等。
  • 具体描述示例:
    • “朗读功能失效,且可选语音相当生硬,读不出语气的起伏”
    • “之前都能访问视频的,现在访问不了了”
    • “更新之后,之前含图片的对话框动不动就到限额然后无法继续”
  1. 回答质量与准确性
  • 描述: ChatGPT 在回答问题时出现错误、不准确、答非所问等问题,也包括对用户意图理解不足的问题。
  • 具体描述示例:
    • “不太理解我问的问题。每次在哪里转转转,结果转了半天给的答案不仅仅是错的”
    • “回答有很多错误!连错四次并且最后回到了最初的错误”
    • “升级到o后发现经常他会胡言乱语甚至有时候和3.5出来的东西一个水平”
  1. 信息来源与偏向
  • 描述: ChatGPT 在搜索信息时出现偏向性、信息来源不足、信息过时等问题,包括对中国平台信息的偏好,以及无法使用本地信息等。
  • 具体描述示例:
    • “现在让它搜东西都是知乎 新浪 搜狐 豆瓣等中国平台”
    • “数据不够,无法准确回答闲鱼价格的问题”
    • “现在全部都给我在网上搜文章,我在国外,使用中文,需要了解当地的内容,gpt就全给我在国内找资料”
  1. 限制与付费问题
  • 描述: 用户对免费功能的限制、付费方式不便、付费后仍有功能限制等问题。
  • 具体描述示例:
    • “现在是2024/11/05,我受不了了,用的模型4o,回答的问题大部分都是错误的”
    • “GPT-4o是有免费次数的,用完后要2小时才能继续用4o模型”
    • “传输文件次数也有限制,用完后也要等2小时”
       6.其他问题
  • 描述: 一些无法归类到以上类别的零散问题,例如: 审核机制、数据隐私、语音质量、用户体验、对国内AI的对比等。

5.2.1 Google Play数据缺点统计

缺点(全量计次) 数量 比例
功能缺陷与不稳定 110 21.70%
回答质量与准确性 116 22.88%
连接与登录问题 185 36.49%
其他问题 23 4.54%
限制与付费问题 63 12.43%
信息来源与偏向 10 1.97%
总和 507 100.00%


Google Play安卓用户负面反馈分类统计

从数据来看,最大的问题是网络连接问题(36.49%),这作为一个几乎无法合法解决的问题,可以视为国内产品的优势;
其次是回答问题的质量和准确性(22.88%),这需要更多的是基础模型的优化以及相关提示词的优化,可以在提示词上给用户提供更多和低门槛的参考,同时在特定领域可以进行微调,给用户更多的选择;
值得产品经理重点关注的是功能缺陷和不稳定性(21.7%),这里面的内容值得逐条关注,并且进行相关的功能优化;
限制与付费问题(12.43%)占据的比例不高,不过从具体内容也可以反映出中国用户的付费习惯与其他地区可能存在差异,针对付费和非付费用户及付费流程简化可以进行相关优化;
最后是信息来源与偏向(1.97%)和其他问题(4.54%)也需要适当进行关注,提高产品的使用体验。

六、竞品分析

针对国外和国内市场选取Google Gemini和豆包作为分析对象。

6.1 市场竞争格局


全球AI APP下载量TOP5(2024年12月,数据来源:点点数据)
根据点点数据的数据显示,2024年12月,全球(含中国大陆)AI APP苹果端预估下载总量达6975.2万,其中,ChatGPT、Google Gemini、豆包、Kimi智能助手及ChatOn AI位列TOP 5,占据了全球苹果端AI下载量的56%。

大陆市场AI APP苹果端下载量分布(2024年12月,数据来源:点点数据)
相应地,2024年12月,大陆市场AI APP苹果端预估下载量达1818.0万,豆包与Kimi继续领跑,二者分别以33%、25%的下载量占比占据第一梯队。(澎湃新闻, 2024)
由上述数据可知在通用ChatBot产品的竞争中,国际市场主要是Gemini和ChatGPT引领市场,而在国内市场上豆包遥遥领先。

6.2 与竞品的差异化分析

核心功能对比表格如下:

功能 ChatGPT Gemini 豆包
开发者 OpenAI Google 字节跳动
AI 模型 GPT-4o mini(免费);GPT-4、GPT-4o、01-preview 和 o1 mini(付费) Gemini 1.5 Flash(免费);Gemini 1.5 Pro(付费) 豆包通用模型 pro、豆包通用模型 lite等
上下文窗口 128,000 个token 最多 1,000,000 个token 128,000 个token
支持的语言 超过 50 种 超过 40 种 6种
平台 Web、移动、桌面 Web 和移动 Web、iOS、安卓、Windows、macOS
价格 免费;ChatGPT Plus 每月 $20 免费;Gemini Advanced 每月 $19.99(前两个月免费) 免费;商业化模式下,价格为 0.0008 元/千 Tokens
图像生成 使用 DALL·E 3(免费账户有限制) 使用 Imagen 3(无图像生成数量限制) 支持图片理解和视频生成功能
记忆功能 默认启用,自动记录用户偏好以定制响应 仅限网页端订阅用户,类似 ChatGPT 的自定义指令 不支持
文件转换 支持将文件从一种格式转换为另一种格式,例如文章到演示文稿 不支持 支持多种文档解析和处理
数据管理 支持存档对话功能 支持存档对话功能 支持存档对话功能
网络搜索 使用 Microsoft Bing 使用 Google 搜索 基于互联网公开信息进行搜索和整合
生态系统集成 可与多种应用集成,包括 Google Drive,需手动选择文件 深度集成 Google 应用(如 Gmail、云端硬盘、地图等),可直接提取内容 与字节跳动旗下产品(如抖音、飞书等)深度集成
自定义聊天机器人 支持构建自定义 GPT,无限制数量,可上传知识文件,支持图像生成和代码运行 支持 Gemini Gems,自定义功能有限,不支持图像生成和语音模式互动 支持创建个性化定制的智能体,数量已超过 800 万
对话共享 支持分享对话,但无法分享带有 AI 生成图像的对话 支持分享对话,包括 AI 生成图像 支持
目标用户 面向广泛用户,提供更灵活的集成选项 更适合深度使用 Google 生态系统的用户 适合字节跳动生态系统用户,特别是在中国市场

(Zapier, 2025)

总的来说,这三者的差异点在于:
1.ChatGPT:更加专业化和国际化,在逻辑推理、代码生成有优势。
2.Gemini:深度服务于Google用户,依托其生态能够带来独特的便捷性。
3.豆包:本地化优化,亲民价格和中文表现更加适合中国用户。

6.3 ChatGPT的差异化优势

ChatGPT的优势集中在以下几点:
1.逻辑推理和代码支持:强大的链式推理和代码生成运行能力。
2.自定义与工具化:支持高度自定义的聊天机器人和网页演示功能。
3.平台与集成:跨平台兼容性和多样化第三方集成。
4.图像生成与创意支持:更成熟的 DALL·E 3 图像生成工具。

七、总结

7.1 SWOT分析

  • 优势 (Strengths):
    • 强大的内容生成能力: 基于 GPT-4o 等先进大语言模型,ChatGPT 在文本生成、代码生成、内容创作等方面表现出色,能够生成高质量、多样化的内容。
    • 跨平台协同: ChatGPT 提供 Web、移动、桌面等多平台支持,用户可以在不同设备间无缝切换,保持一致的使用体验,这有利于形成用户粘性。
    • 多模态输入: 安卓端支持语音、图像、视频、文档等多种输入方式,提供了更灵活、便捷的交互体验,特别是在移动场景中。
    • 强大的逻辑推理和代码支持: 在逻辑推理、代码生成和运行方面具有显著优势,满足专业用户的需求。
    • 高度自定义和工具化: 支持用户自定义聊天机器人和构建演示功能,满足了用户个性化的需求。
  • 劣势 (Weaknesses):
    • 移动端功能限制: 相较于 Web 端,ChatGPT 安卓版在功能上仍然存在一些限制,比如某些多模态功能可能不如网页版稳定,一些高级功能(如自定义指令)可能尚未完全同步。
    • 网络连接问题: 在国内使用,常常出现无法连接、登录缓慢或频繁报错的问题,极大地影响了用户体验。
    • 信息准确性和幻觉问题: ChatGPT 有时会提供不准确的信息,甚至编造内容,这降低了用户的信任度。
    • 用户体验细节问题:例如交互不够高效,编辑后产生错乱,代码无法复制粘贴,消息回复数量限制等问题。
    • 数据偏向性: 搜索结果更多偏向国内平台,且对最新信息和本地信息支持不足。
    • 付费限制和用户接受度: 免费功能受限,且付费后某些功能(如 4o 模型)仍有使用次数限制,付费门槛和用户付费意愿有待提升。
  • 机会 (Opportunities):
    • AIGC 在移动端市场的快速发展: 随着人工智能技术的普及,越来越多的用户习惯在移动端使用 AI 工具,这为 ChatGPT 安卓版带来了巨大的市场潜力。
    • 碎片化场景的需求: 用户在碎片化时间中对高效、便捷的 AI 工具需求日益增长,ChatGPT 可以满足用户在移动场景下的多项需求,如快速生成内容、辅助学习、提高办公效率等。
    • 个性化和场景化: 可以针对不同用户群体和特定场景进行定制化服务,进一步提高用户粘性。
    • AI Agent的兴起: AI Agent 代表了未来AI应用的新方向,能主动帮助用户完成特定任务,ChatGPT可以拓展这方面的能力。
  • 威胁 (Threats):
    • 竞品功能快速追赶: Google Gemini、豆包 AI 助手等竞品也在快速迭代,不断提升自身功能和用户体验,尤其是在移动端市场。
    • 用户忠诚度较低: AI 工具同质化现象较为严重,用户容易转向其他同类产品,用户忠诚度有待提高。
    • 数据安全与隐私风险: 用户对于 AI 工具的数据安全性和隐私保护问题日益关注,ChatGPT 如果在这方面做得不够好,可能会导致用户流失。
    • 技术壁垒可能被突破: 随着更多大模型出现,ChatGPT可能面临技术优势被追赶的风险。

7.2 产品优化建议

  • 性能优化:
    • 提升移动端响应速度和加载流畅度: 减少应用启动时间、页面加载时间,优化模型推理速度,提高整体用户体验。
  • 功能增强:
    • 增强移动端的独特功能: 针对移动场景开发更便捷的语音交互、手势操作等功能,提高移动端的使用效率。
    • 优化多模态交互: 提升语音、图像、视频等多种输入方式的识别准确性和处理速度。
    • 强化特定领域能力:在编程辅助、内容创作、知识查询等特定领域,提供更深入、专业的解决方案,例如垂直模型。
  • 改进内容准确性:加强训练数据质量和模型微调,解决模型幻觉和错误输出。
  • 完善功能细节:优化编辑、复制粘贴、数据保存等细节功能,减少用户操作障碍。
  • 优化信息来源: 减少对特定平台信息的偏好,并支持更多本地化信息接入。
  • 用户体验优化:
    • 简化用户界面: 优化界面布局,减少操作步骤,提高用户操作效率。
    • 增强个性化: 提供更多个性化设置选项,让用户可以根据自己的需求定制 ChatGPT 的使用方式。
    • 提供更清晰的提示词: 引导用户通过提供高质量的 prompt 来获得更准确的输出。
  • 付费体系优化: 提供更灵活的付费方案,让用户在免费和付费功能之间更容易做出选择。

7.3 未来发展策略

  • 用户教育与推广:
    • 针对安卓用户的功能教育: 通过教程、视频等方式,引导用户了解和使用 ChatGPT 安卓版的各种功能,尤其是在移动场景下的应用。
    • 营销推广: 通过社交媒体、应用商店等渠道,扩大产品知名度和用户覆盖率。
  • 技术创新:
    • Ai Agent: 拓展AI Agent的功能,帮助用户完成更多自动化任务,增加产品竞争力。
    • 模型迭代:持续迭代优化模型,提高内容生成质量,提升知识覆盖和推理能力。
  • 商业化探索:
    • 广告模式:探索在保证用户体验的前提下,引入广告模式,增加营收来源。
    • 平价化:考虑推出更平价的订阅方案,降低付费门槛,吸引更多用户。
    • 产品差异化订阅:针对不同用户群体,推出不同的订阅服务,满足用户的个性化需求。
  • 生态建设:
    • 深度集成: 与其他应用和服务进行深度集成,构建更完善的应用生态。

参考资料

Bhaimiya, S. (2023, February 2). ChatGPT may be the fastest-growing consumer app in internet history, reaching 100 million users in just over 2 months, UBS report says. Business Insider. Retrieved from https://www.businessinsider.com/chatgpt-may-be-fastest-growing-app-in-history-ubs-study-2023-2

Reddit. (2023a, April 19). What do you actually use ChatGPT for? [Online forum discussion]. Reddit. Retrieved from https://www.reddit.com/r/ChatGPT/comments/12stfb9/what_do_you_actually_use_chatgpt_for/

Reddit. (2023b, May 3). What do you all actually use ChatGPT for? [Online forum discussion]. Reddit. Retrieved from https://www.reddit.com/r/ChatGPT/comments/133mc2v/what_do_you_all_actually_use_chatgpt_for/

Reddit. (2024, June 15). What do you use ChatGPT for in your daily life? [Online forum discussion]. Reddit. Retrieved from https://www.reddit.com/r/ChatGPTPromptGenius/comments/1fcklhp/what_do_you_use_chatgpt_for_in_your_daily_life/

腾讯新闻. (2025, January 7). ChatGPT Pro subscription is currently running at a loss. Retrieved from https://news.qq.com/rain/a/20250107A0106N00?utm_source=chatgpt.com

ESM China. (n.d.). OpenAI explores B2B monetization strategies for ChatGPT. Retrieved January 9, 2025, from https://www.esmchina.com/trends/43605.html?utm_source=chatgpt.com

The Times. (n.d.). OpenAI considers advertising for ChatGPT. Retrieved January 9, 2025, from https://www.thetimes.com/business-money/technology/article/openai-considers-advertising-for-chatgpt-cqhdcj85f?utm_source=chatgpt.com&region=global

The Wall Street Journal. (n.d.). OpenAI, Bain expand AI partnership to sell ChatGPT to businesses. Retrieved January 9, 2025, from https://www.wsj.com/articles/openai-bain-expand-ai-partnership-to-sell-chatgpt-to-businesses-d17775dc?utm_source=chatgpt.com

Statista. (n.d.). Number of monthly ChatGPT and Gemini mobile app downloads worldwide from May 2023 to September 2024. Retrieved January 9, 2025, from https://www.statista.com/statistics/1497377/global-chatgpt-vs-gemini-app-downloads/#statisticContainer

Sensor Tower. (n.d.). Category rankings and app analysis for ChatGPT (October 12, 2024 - January 9, 2025). Retrieved January 9, 2025, from https://app.sensortower.com/app-analysis/category-rankings?os=android&start_date=2024-10-12&end_date=2025-01-09&uai=64665f59b3ae2712001279ed&saa=com.openai.chatgpt

Sensor Tower. (2024, January). 2024年AI应用市场洞察: 2024年1-8月收入同比激增51%,突破20亿美元,预计2024全年收入达到33亿美元. Sensor Tower. Retrieved from https://sensortower.com/zh-CN/blog/state-of-ai-apps-2024-report-CN

小红书. (2024). 策略向|如何评测大模型效果. 小红书. Retrieved from https://www.xiaohongshu.com/explore/66f67165000000001b020b6d?xsec_token=ABX5jB7KY821V26oUNvAaIFT6T4nXH57isPoDz1sMt1JI=&xsec_source=pc_search&source=web_explore_feed

知乎. (2024). LLM Evaluation 如何评估一个大模型?. 知乎. Retrieved from https://zhuanlan.zhihu.com/p/644373658

OpenAI. (2024). ChatGPT — Release Notes. OpenAI. Retrieved from https://help.openai.com/en/articles/6825453-chatgpt-release-notes

澎湃新闻. (2024). 12月AI月报:iOS全球下载6975万,谷歌Gemini崛起,星野买量大涨300%超越豆包. 澎湃新闻. Retrieved from https://m.thepaper.cn/newsDetail_forward_29852815

Zapier. (2025). Gemini vs. ChatGPT: What’s the difference? Zapier. Retrieved from https://zapier.com/blog/gemini-vs-chatgpt/