7 LLM Data Science
7.1 LLMs Data Science Stategy
7.1.1 Q: 用什么方式提问关于用R语言开展数据科学,作数据分析的问题,最有效,最合适?
7.1.2 GPT 4.0
7.1.3 1. 明确问题背景
提供相关背景信息,使回答者能够了解问题的整体情况。例 如:
你正在分析什么类型的数据?
数据集的规模和结构是怎样的?
你已经尝试过哪些方法?
我正在分析一个包含100,000条记录的医疗数据集,数据包括患者的基本信息、诊断记录和治疗结果。我想用R语言进行回归分析,但遇到了一些问题。以下是我目前的问题和尝试过的步骤:
7.1.4 2. 具体描述问题
清晰、具体地描述你的问题。避 免模糊的描述,确保问题明确。
在进行线性回归时,我得到的R-squared值非常低。我 想知道是否有其他方法可以提高模型的拟合度。以 下是我使用的代码和输出:
7.1.5 3. 提供代码示例
提供你使用的代码和相关的数据样本,使他人能够复现你的问题。这 有助于回答者更准确地理解和解决你的问题。
7.1.6 4. 描述预期结果与实际结果的差异
说明你预期的结果是什么,以及你实际得到的结果之间的差异。
7.1.7 通义千问
要在关于使用R语言开展数据科学和进行数据分析的问题上获得最有效、最合适的回答,您可以遵循以下几点建议来构建您的问题:
明确具体问题:尽量具体描述您遇到的问题或想要实现的功能。比 如,不要只问“如何用R做数据分析”,而是具体到例如“如何用R中的tidyverse包进行数据清洗和预处理”。
提供背景信息:简要说明您正在进行的项目或分析的背景,这有助于回答者更好地理解您的需求。例 如,“我在分析一组销售数据,需要找出季节性趋势。”
展示已尝试的解决方案:提及您已经尝试过的代码片段或方法,以及为什么这些尝试没有达到预期效果。这 样可以避免回答者提供您已经试过的解决方案。
附上示例数据:如果可能,提供一小段示例数据或者数据结构的描述。这 可以让回答者直接运行代码并测试解决方案,提高解答的准确性和实用性。
明确求助点:指出您需要帮助的具体环节,比如数据导入、数据处理、统计建模、可视化等。
使用正确的术语:尽量使用R语言或数据科学中的标准术语,这有助于对方快速理解您的问题。
格式化代码和输出:如果包含代码,请确保代码格式清晰、易于阅读,并适当使用Markdown或代码块格式化。对 于错误信息,完整复制粘贴,不要遗漏。
7.2 Keep Learning
David Robinson, R Screen Cast