AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火

news2025/6/25 19:13:51

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:AIbase - 智能匹配最适合您的AI产品和网站

QQ截图20240410151413.png

📰🤖📢AI新鲜事

OpenAI发布GPT-4-Turbo 正式版 自带读图能力

image.png

【AiBase提要:】

⭐GPT-4-Turbo正式版全面开放,可通过“gpt-4-turbo”来使用此模型,最新版本为“gpt-4-turbo-2024-04-09”

⭐GPT-4-Turbo是带有视觉能力的模型,可处理128k上下文。

⭐ 价格不变,输入$10.00/100万tokens,输出$30.00/100万tokens,读图:最低 $0.00085/ 图

接口信息:https://platform.openai.com/docs/models/continuous-model-upgrades

价格信息:https://openai.com/pricing

相关限制:https://platform.openai.com/docs/guides/rate-limits/usage-tiers?context=tier-five

重磅!GPT-4API全面开放使用

【AiBase提要:】

⚙️ GPT-4具备更强的创造性,支持生成、编辑并共同迭代创意和技术写作任务。

🔍 GPT-4有更长的上下文处理能力,适用于创建长格式内容、扩展对话以及文档搜索和分析等场景。

🏢 企业如摩根士丹利已开始应用GPT-4,将其嵌入内部机器人,帮助财务人员查找资料并节省时间。

API详细使用说明地址:https://platform.openai.com/docs/guides/gpt

谷歌宣布Gemini1.5Pro开放API 新增多项功能

image.png

【AiBase提要:】

🎵 Gemini1.5Pro引入了原生音频理解能力,不需先转换为文本。

📄 Gemini1.5Pro扩展了输入模态范围,支持视频内容处理。

💻 Gemini API改进,加入系统指令引导模型响应和JSON模式。

详情点此查看:

https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

音频理解能力:

https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb

SD3将于4月中旬发布!预计会有6种规模的模型

QQ截图20240410102202.png

【AiBase提要:】

⭐ SD3计划在四月中旬正式发布,已发布两篇关于SD3和SD3Turbo的论文

⭐ SD3可能拥有多达6种不同规模的模型,满足不同需求。

⭐ SD3具有80亿参数,适用于RTX4090,生成1024x1024图像需34秒。

SD3论文:https://arxiv.org/abs/2403.12015

SD3Turbo论文:https://arxiv.org/abs/2403.03206

更多SD3制作图像点此查看:https://sd3.art/

性能超H100!英特尔发布新一代人工智能芯片Gaudi3压力给到英伟达!

1.jpg

【AiBase提要:】

⭐ Gaudi3性能超英伟达H100,是最强AI芯片之一

⭐ Gaudi3能效是英伟达芯片的两倍多,速度也快

⭐ Gaudi3采用先进5nm工艺,配备128GB HBM2e内存

详细:

https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-gaudi-3-ai-accelerator.html#gs.7q25hh

Poe为AI机器人创建者引入了按消息定价的收入模式

【AiBase提要:】

⭐ Poe 推出了一种信息收费的收入模式

⭐ 新收入模式将有助于激励开发更多种类的机器人

⭐ 创作者可以为他们的机器人设置每条消息的价格,赚取收入。

刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁

【AiBase提要:】

🌟 Mistral AI再次发布磁力链,解禁281GB的8x22B MoE模型。

🌟 Mistral AI靠一条磁力链掀起AI社区热潮。

🌟 新的MoE模型支持多语言、性能强大,旗舰版直接对标GPT-4。

详情:刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁

抖音AI特效一键生成宫崎骏画风爆火

image.png

【AiBase提要:】

⭐ 电影宣传团队与抖音合作推出宫崎骏动画风格的AI特效,吸引200万用户参与。

⭐ 使用特效引发争议,支持者认为向宫崎骏致敬,反对者则认为违背大师意愿。

⭐ 争议中指出宫崎骏对AI动画技术的抵制,但实际视频并非AI技术。

详情:抖音AI特效一键生成宫崎骏画风爆火

Suno音乐攻占B站鬼畜区 “钢门松弛”成最热门题材

image.png

【AiBase提要:】

🎶 歌曲“你的钢门比较松弛”在B站引发热潮,吸引数百万网友关注。

🎤 AI音乐走红,Suno软件领衔鬼畜音乐创作,获得突破性成功。

📈 AI音乐评论区氛围和谐,网友以幽默和调侃方式互动,展现创意风采。

详情:Suno音乐攻占B站鬼畜区 “钢门松弛”成最热门题材

苹果公司发布新型机器学习语言模型MLLLLM Ferret-UI 用于理解应用 UI 界面

image.png

【AiBase提要:】

⭐️ Ferret-UI是专为移动UI屏幕设计的MLLLM,具备引用、定位和推理能力。

⭐️ 采用“任何分辨率”技术,提高模型对小型对象的理解精度。

⭐️ Ferret-UI通过对话能力在详细描述、交互对话和功能推断等任务中表现突出。

论文地址:https://arxiv.org/pdf/2404.05719.pdf

马云内网发声:肯定阿里变革一年成效 称 AI 时代刚刚到来

【AiBase提要:】

⭐ 马云肯定阿里新管理层勇气,称公司重回健康成长轨道

⭐ 马云认为阿里最核心变化是重回客户价值轨道

⭐ 马云预测互联网行业未来三至五年将发生翻天覆地变化,AI时代正当其时

🤖📱💼AI应用

百度网盘推出AI创意生成工具“超能画布”

微信截图_20240410111214.png

【AiBase提要:】

⭐ 独特的图像大模型和智能人脸融合算法

⭐ 提供丰富的背景、服装切换选项

⭐ 可对人物表情、发色进行局部重绘

体验地址:超能画布使用入口地址 Ai网站最新工具和软件app下载

现阶段有效白嫖(免登录) GPT-3.5的项目

image.png

1⃣Aurora https://github.com/aurora-develop/aurora

(各种花式白嫖,支持 Render/Vercel 等一键部署)

2⃣ChatGPT https://github.com/PawanOsman/ChatGPT

(支持 Docker & Android,很稳定)

3⃣FreeGPT35https://github.com/missuo/FreeGPT35

(参数多,支持 Nginx 反向代理)

谷歌将推全新AI视频工具Google Vids 集多种功能一体

1.png

【AiBase提要:】

📱 Google Vids集多种功能于一体,帮助用户轻松创作故事板。

🖼️ AI技术协助编辑内容,选择适合的场景、图片和音乐。

🎙️ 用户可为视频加上配音,提升视频个性化和专业度。

AI也可以生成延时视频了 MagicTime输入文本即可生成植物生长视频

image.png

【AiBase提要:】

⭐️MagicTime模型专注于生成变形时间延迟视频

⭐️生成的视频符合现实世界物理规律,可以生成比较自然的植物生长过程视频。

⭐️对提示的理解更准确,生成的质量也比较高

项目演示:MagicTime使用入口地址 Ai模型最新工具和软件app下载

代码:https://github.com/PKU-YuanGroup/MagicTime

DreamWalk:实现对图像生成风格和内容的精细控制

image.png

【AiBase提要:】

⭐ 用户可以更加自由地决定图像中哪部分应该更加强烈地体现某种风格

⭐ DreamWalk支持在不同风格间进行平滑过渡,保证生成图像更加和谐统一

⭐ 可将现实世界图像转换为特定风格的艺术作品,满足用户对多样化图像风格的需求

项目演示:DreamWalk使用入口地址 Ai模型最新工具和软件app下载

论文:https://arxiv.org/pdf/2404.03145.pdf

金山办公WPS365升级 推出 WPS AI 企业版和 WPS 协作

微信截图_20240409173433.png

【AiBase提要:】

⭐️ WPS365整合文档、AI和协作能力,实现一站式AI办公。

⭐️ WPS AI企业版降低使用大模型门槛,提供智能创作与数据分析功能。

⭐️ WPS365模式让用户通过一个产品高效完成所有工作,实现办公新质生产力。

——————

每日midjourney prompt:电商模特——比基尼

A Beautiful Chinese Girl with long dark hair,Wearing a green silk camisole shirt and a flowing skirt, sitting on rocks by the ocean, eyes closed, serene expression, realistic, photorealistic, detailed,8k --ar3:4--q2--s750

2_1712731778423_ai2023_A_Beautiful_Chinese_Girl_with_long_dark_hairWearing_a_gr_640afd7f-fbad-4f5f-821f-e248f1c0cf48.png

一个美丽的中国女孩,留着一头乌黑的长发,穿着绿色丝绸背心和飘逸的裙子,坐在海边的岩石上,闭着眼睛,表情安详,逼真,细节,8k

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1584249.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

特征融合篇 | YOLOv8改进之将Neck网络更换为多级特征融合金字塔HS-FPN | 助力小目标检测

前言:Hello大家好,我是小哥谈。HS-FPN(Hierarchical Scale Feature Pyramid Network)是一种用于目标检测任务的网络结构。它是在传统的Feature Pyramid Network(FPN)基础上进行改进的。HS-FPN的主要目标是解决目标检测中存在的多尺度问题。在传统的FPN中,通过在不同层级…

CNN-Transformer时间序列预测

部分代码: # CNN-Transformer class CNNTransformerEncoder(nn.Module):def __init__(self, input_features, transformer_encoder_heads,embedding_features, cnn_kernel_size, dim_feedforward_enc, n_encoder_layer):super(CNNTransformerEncoder, self).__init…

大语言模型:红蓝对抗的工作原理及作用

您是否对强大的生成式AI领域心生好奇,却又担心随之而来的潜在漏洞?您只需了解红蓝对抗就好了,它也称为破解或提示注入。AI开发的这一关键环节往往被忽视,但其在提高生成式AI模型的性能方面发挥的作用却至关重要。 大语言模型&…

JavaScript进阶6之函数式编程与ES6ESNext规范

函数式编程 柯里化currycurrycompose示例:简化版展开写: debug示例一:示例二: 模板字符串css in js方案 箭头函数问题 生成器 generator应用场景 反射 Reflect 柯里化curry compose是curry的应用 在 lodash/fp underscore ramba …

vue2创建项目的两种方式,配置路由vue-router,引入element-ui

提示:vue2依赖node版本8.0以上 文章目录 前言一、创建项目基于vue-cli二、创建项目基于vue/cli三、对吧两种创建方式四、安装Element ui并引入五、配置路由跳转四、效果五、参考文档总结 前言 使用vue/cli脚手架vue create创建 使用vue-cli脚手架vue init webpack创…

JVM虚拟机(二)类加载器、双亲委派模型、类装载的执行过程

目录 一、类加载器1.1 什么是类加载器?1.2 类加载器的分类 二、双亲委派模型2.1 什么是双亲委派模型?1) 示例一:加载自己创建的类2)示例二:加载JDK原有的类 2.2 JVM 为什么采用双亲委派模型? 三…

3. DAX 时间函数-- DATE 日期--一生二,二生三,三生万物

在数据分析过程中,经常需要从一个数据推到另外一个数据,日期数据也是如此,需要从一个日期推到另外一个相关的日期,或者从一群日期推到另外一个相关的日期/一群相关的日期。这一期说的就是日期之间彼此推衍的函数,会比之…

笔记83:二叉树前中后序遍历(迭代法 + 栈)

题目:. - 力扣(LeetCode) 注意:以下代码均为个人尝试编写,并非力扣题解,因此时间和空间复杂度可能并不是最优的,只是记录一下自己当时写这个题的时候的思路; 前序遍历: …

嵌入式ARM版本银河麒麟操作系统V10SP1安装OPenGauss数据库

前言: 官网提供了非常完整的openGauss安装步骤。 https://opengauss.org/zh/download/archive/列举一下个人的使用环境: 麒麟V10 rk3588工控板(ARM) openGauss-3.0.5(极简版)浏览一下官网,可以…

Unity Pro 2019 for Mac:专业级游戏引擎,助力创意无限延伸!

Unity Pro 2019是一款功能强大的游戏开发引擎,其特点主要体现在以下几个方面: 强大的渲染技术:Unity Pro 2019采用了新的渲染技术,包括脚本化渲染流水线,能够轻松自定义渲染管线,通过C#代码和材料材质&…

2024-04-10 作业

作业要求&#xff1a; 1> 思维导图 2> 作业1&#xff1a; 作业2&#xff1a; 运行代码&#xff1a; main.cpp #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include <QDebug> #include <QTimerEvent> #include <QTime> #include &…

零售EDI:Princess Auto EDI对接

Princess Auto 是一家加拿大零售连锁店&#xff0c;专门从事农场、工业、车库、液压和剩余物品的销售。 Princess Auto 总部位于马尼托巴省温尼伯&#xff0c;截至 2024 年 1 月在 10 个省份拥有并经营 55 家商店以及三个配送中心。各种商品均以其“Powerfist”和“Pro.Point”…

网络IO模型以及实际应用

网络IO模型 本文主要介绍了几种不同的网络IO模型&#xff0c;以及实际应用中使用到的Reactor模型等。 我们常说的网络IO模型&#xff0c;主要包含阻塞IO、非阻塞IO、多路复用IO、信号驱动IO、异步IO。 根据第一个阶段&#xff1a;是否需要阻塞&#xff0c;分为阻塞和非阻塞IO。…

华为ensp中PPP(点对点协议)中的CHAP认证 原理和配置命令

作者主页&#xff1a;点击&#xff01; ENSP专栏&#xff1a;点击&#xff01; 创作时间&#xff1a;2024年4月11日6点00分 PPP协议&#xff08;Point-to-Point Protocol&#xff09;是点到点协议&#xff0c;是一种常用的串行链路层协议&#xff0c;用于在两个节点之间建立点…

虚幻引擎架构自动化及蓝图编辑器高级开发进修班

课程名称&#xff1a;虚幻引擎架构自动化及蓝图编辑器高级开发进修班 课程介绍 大家好 我们即将推出一套课程 自动化系统开发。 自动化技术在项目开发的前中后期都大量运用。如何您是一家游戏公司&#xff0c;做的是网络游戏&#xff0c;是不是经常会遇到程序员打包加部署需…

MySQL 主从复制部署(8.0)

什么是主从数据库 主从数据库是一种数据库架构模式&#xff0c;通常用于提高数据库的性能、可用性和可伸缩性。 它包括两种类型的数据库服务器&#xff1a; 1&#xff09;主数据库&#xff08;Master&#xff09;&#xff1a;主数据库是读写数据的主要数据库服务器。所有写操…

Llama 3下月正式发布,继续开源!

4月10日&#xff0c;Techcrunch消息&#xff0c;Meta在本周伦敦举办的一场活动中确定&#xff0c;下个月将正式发布Llama 3并且继续开源。 Meta全球事务总裁Nick Clegg表示&#xff0c;我们希望在下个月&#xff0c;甚至更短的时间内&#xff0c;正式推出新一代基础模型Llama …

Builder 生成器

意图 将一个复杂对象的构建与它的表示分离&#xff0c;是的同样构建过程可以创建不同的表示。 结构 其中 Builder为创建一个Product对象的哥哥部件指定抽象接口ConcreteBuilder实现Builder的接口以构造和装配该产品的各个部件&#xff0c;定义并明确它所创建的表示&#xff…

【I/O】基于事件驱动的 I/O 模型---Reactor

Reactor 模型 BIO 到 I/O 多路复用 为每个连接都创建一个线程 假设我们现在有一个服务器&#xff0c;想要对接多个客户端&#xff0c;那么最简单的方法就是服务端为每个连接都创建一个线程&#xff0c;处理完业务逻辑后&#xff0c;随着连接关闭线程也要销毁&#xff0c;但是…

鸿蒙实战开发-如何实现标准化数据定义与描述的功能。

介绍 本示例主要使用ohos.data.uniformTypeDescriptor 展示了标准化数据定义与描述的功能&#xff0c;在新增预置媒体文件后&#xff0c;对媒体文件的utd标准类型获取、utd类型归属类型查询、获取文件对应的utd类型的默认图标、支持自定义数据类型等功能。 实现过程中还使用到…