发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 867 0 2025-8-19 14:02:51

1.我的需求:

每天我会收集一些和股票相关的新闻,这些新闻有些是重要的(比如:xx 公司开发了新药),其他大部分都没什么价值,由于新闻太多了,看不过来,而这个又比较依赖人工的判断,不能简单的通过关键字去匹配,所以想通过微调大模型来实现,得出类似这样的结构:

{ keyword:"创新药", analysis:"新药可以带动市场情绪", label:"对股票利好" }

2.我的问题:

  • 针对上面的问题,应该是属于哪一类任务呢,简单的文本分类不太满足,
  • 我对大模型不是很熟悉,但是常见的微调,rag,agent 都简单的玩过,请教各位大佬使用哪个模型,哪种数据结构来微调比较好(我咨询过阿里的社区,建议是使用问答来做,而不是分类,有点迷惑了),有这方面实际操作的建议吗
──── 0人觉得很赞 ────

使用道具 举报

2025-8-19 18:22:37
那要不要试试微调一个二分类模型?
输入是新闻,输出的标签是利好或者不利好。
感觉可以考虑用BERT之类的。
不过我觉得这有点玄乎。
2025-8-20 19:48:53
你的需求无需微调。
可以直接编写带fewshot(几个示例)的提示词,再借助Python库pydantic ai提取特定格式的内容。
参考 Output  Pydantic AI
2025-8-21 08:01:12
但是,这条新闻能不能算得上是重大利好消息呢?我们打算先人工标记一部分内容,用来对其进行训练。毕竟单纯依靠通用模型的话,它根本不清楚什么才是重要的呀。  
2025-8-23 17:28:25
有类似的提示词可以参考推荐吗?
这种主观判断,
不知道怎么给出比较准确的提示词。
2025-8-24 19:01:37
我一开始想的是这个方案,采用最简单的多分类,用label构建数据集。

但这种数据结构没办法携带keyword和analysis这类额外数据(AI不会去学习这些)。

所以我在阿里社区问了一下,他们说这种方式早就不用了。对于复杂格式,更推荐用问答的方式来做。

这下我也迷茫了。
2025-8-28 06:15:26
1. 我的需求:
您需要登录后才可以回帖 立即登录
高级模式