From 5f31c9ec085f4305fd581c16cf518177e6c6d78f Mon Sep 17 00:00:00 2001 From: cjy Date: Wed, 4 Mar 2026 11:47:17 +0800 Subject: [PATCH] =?UTF-8?q?fix=EF=BC=9A=E8=B0=83=E6=95=B4=E6=8F=90?= =?UTF-8?q?=E7=A4=BA=E8=AF=8D=EF=BC=8C=E4=BC=98=E5=8C=96ai=E5=85=B3?= =?UTF-8?q?=E4=BA=8E=E9=85=8D=E4=B9=90=E4=BA=AE=E7=82=B9=E7=9A=84=E5=9B=9E?= =?UTF-8?q?=E5=A4=8D?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- pkg/service/ai/video_vl.go | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/pkg/service/ai/video_vl.go b/pkg/service/ai/video_vl.go index 00c2629f..8b504013 100644 --- a/pkg/service/ai/video_vl.go +++ b/pkg/service/ai/video_vl.go @@ -38,7 +38,7 @@ func AIVideoVL(ctx *gin.Context) { return } - Prompt := "请你详细描述视频和图片中的内容分别是什么" + Prompt := "请你详细描述视频和图片中的内容分别是什么,包括画面内容、人物动作、场景等。如果有配乐或背景音乐,请详细描述配乐的节奏、风格和情感特点" // 调用VL函数进行AI理解 result, err := qwen.VL(req.Videos, req.Images, Prompt, req.Model) @@ -275,7 +275,7 @@ func AICompetitorReport(ctx *gin.Context) { } // 第一步:调用AI理解视频/图片内容 - vlPrompt := "请你详细描述这些视频或者这些图片中的内容分别是什么,请详细描述,不要遗漏任何细节" + vlPrompt := "请你详细描述这些视频或者这些图片中的内容分别是什么,请详细描述,不要遗漏任何细节。如果有配乐或背景音乐,请详细描述配乐的节奏、风格和情感特点" vlResult, err := qwen.VL(req.Videos, req.Images, vlPrompt, req.Model) if err != nil { // 检查是否是文件下载超时错误(内容过大) @@ -329,6 +329,7 @@ func AICompetitorReport(ctx *gin.Context) { 重要提示: 1. 所有字符串值必须使用英文标点符号,包括英文逗号, 英文句号. 英文冒号: 英文引号" 等。禁止使用中文标点符号。 2. 即使没有提供具体数据,也要基于视频和图片内容给出分析性回复。禁止回复"未提供数据"、"暂无数据"等类似内容,而应该根据内容分析数据表现(如根据时长分析完播率潜力、根据内容质量分析互动潜力等)。 +3. 配乐亮点(music字段):禁止回复"未提供配乐信息"、"没有配乐信息"等类似内容。即使没有识别到配乐,也要根据视频整体风格和内容特点编写合理的配乐分析(如:根据视频风格推断适合的配乐类型、根据内容节奏分析配乐潜力等)。 基于以下视频和图片的内容描述: %s