一分钟!图片生成32种动画;Adobe绘画工具大升级;复盘Kaggle首场LLM比赛;VR科普万字长文 | ShowMeAI日报

news2025/6/24 15:35:40

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!

🔥 Adobe Firefly 大升级!图像高清、操作便利,体验感拉满

https://firefly.adobe.com

Adobe Firefly 升级了,增加了很多定制化功能,模型能力也更强大了!生成图片的默认分辨率居然是2048*2048,远超一般图片平台的清晰度了。本次升级要点如下,使用魔法访问上方链接,就可以免费体验了!

  1. 模型升级到 Firefly Image 2,可以创建更逼真的图像,图像质量更高

  2. 支持图生图:相当于 Midjourney 垫图功能

  3. 支持设置照片参数:可以像相机一样更改光圈、快门速度和视角等参数

  4. 提供提示词建议,支持添加反向提示词,支持云储存生成的图片

  5. 将鼠标放在生成的图片上,可以对图片进行二次编辑 ⋙ 官方博客

🧰 图片转动画在线AI工具,一分钟就可以做出32个动画

https://sketch.metademolab.com

前两天社群小伙伴找一个AI工具,用一张图片就可以做成动画。当时,整个群一起沉默了。。。不过!逛小红书时看到了「Animated Drawings」,完美满足需求!无需魔法,点击鼠标就可以让一张图片动起来,还能在32种动作类型中切换

  • 第1步:准备素材,注意四肢不与身体重叠,纯白背景,确保清晰度

  • 第2步:上传图片并裁剪出角色

  • 第3步:AI自动识别角色边界,将主体与背景分开

  • 第4步:AI智能识别骨骼,可以调整绑定关节

  • 第5步:系统预设了32种动画,点击可以查看角色动作

  • 第6步:点击图像右下角标识,可以下载动画 .mp4 视频,找在线工具就可以转成 .gif 格式啦 ⋙ 小红书-视频教程

🧩 Kaggle 首场大模型比赛,金牌解决方案复盘

https://www.kaggle.com/competitions/kaggle-llm-science-exam

Kaggle 作为全球知名的数据科学比赛平台,也参与到了大模型浪潮当中,陆续上线 LLM 相关的比赛和主题分享。

今天要讲的这场比赛「LLM Science Exam」,设定与传统的大模型测评场景比较类似,即给定科学类题目和5个选项ABCDE,选出一个正确答案。

在 Kaggle 平台限制了计算资源、项目时间的情况下,全球大牛们各显神通,给出了不同思路的解决方案。前5名的大佬们用了哪些模型和处理技巧?各类模型表现排名如何?在这篇笔记里写得很清晰了 ⋙ 阅读原文

👀 Poe主流大模型测评榜单:GPT-4完胜,但有意外收获!

https://poe.com/bot_rankings

Poe 是一款聚合了海外主流大模型的AI聊天机器人应用,最近和SurgeAI合作对主流LLM进行了4个维度的评估:推理、和非英语流利程度、创造力性、写作。结果如上图所示,整体客观可信。

GPT-4 拿到了所有第1名,一如既往是「别人家的孩子」。不过,Google-PaLM 对非英语地支持能力排在第2名,Llama-2-70b 在创造性和写作测评中获得第3名,倒是让人耳目一新!值得多做一些模型应用尝试和摸索。测评原理可以访问上方 Poe 链接查看博文~

📜 AI会对HR工作产生哪些影响?这里有一份调查报告

国内外的人才平台和招聘平台正在陆续引进大模型功能。AI对招聘和求职将带来什么影响呢?HR和应聘者持乐观还是悲观态度呢?这份报告给出了1000+人的调研结果。整体来说,双方都对技术发展持乐观态度,但也担心AI偏见等导致的决策失误。

选出了几个调研的关键数据,完整报告和分析可以前往下方原文查看:

  • 约 77% 的HR认为,AI很快就会足够先进,承担聘用决策的重任

  • 约 89% 的受访者认为,AI可以帮助求职者完成申请流程

  • 约 31% 的受访者同意由AI来决定他们是否被录用 ⋙ 阅读原文

📚 万字长文!VR 不完全科普指南,一文了解VR原理和前景

这是一篇易懂又全面的 VR (虚拟现实) 技术的科普文章,全面介绍了 VR 技术发展历史、核心原理和应用前景,读完可以对这一领域有着透彻的理解,跟上目前眼花缭乱的产品发布节奏。以下是文章要点,可以对照查看原文:

一、上帝的画笔:介绍了VR起源,它实现了让人类真正拿起创世神的画笔、描绘并体验虚拟世界的梦想

二、我们应该如何呈现世界

  • 一块屏幕:介绍了VR中使用的显示屏技术的发展和优劣势

  • 把光映入眼中:说明了VR利用凸透镜的原理实现近距离成像和视觉放大

  • 沉浸感的实现:通过双屏幕呈现立体视差,利用人眼合成立体图像的原理

  • 远近感知:讲解了人眼判断距离的生理机制,以及VR中利用眼动调节解决远近感知问题

三、世界应该如何与我们交互

  • 空间定位:介绍了IMU和内外部摄像头追踪的工作原理

  • 面部、眼动和手势追踪:说明了各种传感器实现面部追踪、眼动追踪和手势交互的技术

  • 全彩透视:可以将VR捕捉真实环境,实现数字孪生等应用

四、把大象塞进冰箱的最后一步:对VR头显的核心部件如传感器、芯片进行概述

五、后记:总结了作者的写作心得,对VR技术发展的期待 ⋙ 阅读原文

📋 从VAE到DDPM,一文搞懂AIGC 图像生成模型的发展历程

AIGC 指的是人工智能生成内容 (AI Generated Content),就是最近大火的基于AI生成文字、图片、视频、音频等。AIGC 生成图像的过程用到了 DALL-E、Stable Diffusion 等模型,它们都是基于Diffusion Model、特别是 Conditional DDPM 算法实现的。

这篇文章将原理、公式和代码结合在一起,展示了图像生成模型由简单到复杂的技术发展历程。如果你在学习 Diffusion Model 之前需要补充基础知识,记得回看这篇文章。

  1. AE (AutoEncoder):最基础的重构模型,通过编码器提取图片特征,解码器重构图片

  2. VAE (Variational AutoEncoder):在AE基础上,编码器输出是连续latent变量,使其服从某分布 (如高斯分布),可以生成新的样本

  3. CVAE (Conditional VAE):在VAE基础上引入条件,可以控制生成结果

  4. DDPM (Denoising Diffusion Probabilistic Model):一种生成模型,将数据逐步添加高斯噪音,再逐步去噪重构,可以生成高质量样本

  5. Conditional DDPM:在DDPM中引入条件,控制生成过程 ⋙ 阅读原文

📚 RLHF + Diffusion Models = ?一次很有意思的尝试!

https://www.tanishq.ai/blog/posts/ddpo.html

近年来,生成式AI主要有两大进展,一个是语言模型 (如ChatGPT、LLaMA-2),另一个是图像生成模型 (如DALL-E、Stable Diffusion)。语言模型使用了强化学习中的人类反馈 (RLHF) 技术,使其更容易遵循指示。因此作者提出, RLHF 能否也应用于后者?

  • 作者尝试将强化学习中的 DDPO 算法应用于Stable Diffusion等扩散模型,以优化生成图像的审美质量。具体来说,文章首先建立了将扩散模型形式化为马尔可夫决策过程的框架,然后推导出了DDPO的目标函数,并给出了完整的训练流程。

  • 在ImageNet动物数据集上进行的实验表明,这种方法可以有效提升图像的视觉质量和美感。当然,由于奖励函数本身并不包含语义指示,所以有时生成的图像会偏离原始提示。

总体来说,这项工作展现了强化学习在提升生成模型表现方面的潜力!

感谢贡献一手资讯、资料与使用体验的 ShowMeAI 社区同学们!

订阅合集 #ShowMeAI日报,查看历史消息,接收每日最新推送; 点击公众号底部菜单栏,或者回复关键字 日报 ,可以获取独家AI发展趋势报告、原创AI专题资料合集等。

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ 点击 🎡生产力工具与行业应用大全,一起在信息浪潮里扑腾起来吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1086096.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

钉钉智慧校园小程序如何开发,你知道么!

随着科技的不断发展,数字化已经成为了现代校园发展的重要趋势。在这个背景下,数字智慧校园小程序应运而生,为校园用户提供了更加便捷、高效的生活和学习体验。本文将围绕钉钉数字智慧校园小程序搭建方案进行创作,主要内容包括背景…

在ThingsBoard中,使用部件库自定义RPC下发内容

众所周知,在ThingsBoard中可以对设备进行RPC指令的下发,但有一个限制,必须符合以下的格式 {method:get,payload: {a: a} }所发送的内容必须包含method 与payload。两个字段。 有关RPC的API 可以查询这个链接 https://thingsboard.io/docs/user-guide/rpc/ 但是有朋友要求…

springboot企业客户信息反馈平台springboot39

大家好✌!我是CZ淡陌。一名专注以理论为基础实战为主的技术博主,将再这里为大家分享优质的实战项目,本人在Java毕业设计领域有多年的经验,陆续会更新更多优质的Java实战项目,希望你能有所收获,少走一些弯路…

多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测

多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测 目录 多输入多输出 | MATLAB实现CNN-GRU-Attention卷积神经网络-门控循环单元结合SE注意力机制的多输入多输出预测预测效果基本介绍程序设计往期精彩参考资料 预测效果…

Linux C文件操作

文章目录 文件操作函数文件系统调用系统调用与标准函数c的调用的区别文件的读取位置标准c函数系统调用空洞文件 文件的内存映射操作文件目录 linux下的文件操作包括两种,一种是使用C函数,一种是使用系统调用。 gcc 常用来实现c程序的编译gcc filename.c …

java正则表达式 及应用场景爬虫,捕获分组非捕获分组

正则表达式 通常用于校验 比如说qq号 看输入的是否符合规则就可以用这个 public class regex {public static void main(String[] args) {//正则表达式判断qq号是否正确//规则 6位及20位以内 0不能再开头 必须全是数子String qq"1234567890";System.out.println(qq…

vscode利用lauch.json和docker中的delve调试本地crdb

---- vscode利用delve调试crdb 创建了一个delve容器用于debug crdbdelve: Delve是一个用于Go编程语言的调试器。它提供了一组命令和功能,可以帮助开发人员在调试过程中检查变量、设置断点、单步执行代码等操作。Delve可以与Go程序一起使用,…

自定义spring-boot-starter

自定义加载spring-boot-starter 第一步 创建一个Maven空项目 luban-spring-boot-starter 引入基础依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter</artifactId><version>2.5.0</ve…

Linux下安装DM8

上传iso文件到服务器 文件路径放在 /works/tools/dm8_20230511_x86_rh6_64.iso mount镜像文件 执行mount命令 mkdir /mntdm8mount -t iso9660 /works/tools/dm8_20230511_x86_rh6_64.iso /mntdm8cd /mntdm8 创建数据库用户 groupadd dinstalluseradd -g dinstall -m -d …

测试面试官会做些什么?

虽然没有了金九银十&#xff0c;但是公司的测试HC&#xff08;headcount&#xff0c;指公司HR预计招聘的员工人数&#xff09;还是没有完全锁死&#xff0c;断断续续的也在帮着面试一些人。本文就以自己的经验&#xff0c;从面试官的角度&#xff0c;聊聊面试测试过程中的那些事…

【C/C++】STL——深度剖析list容器

​&#x1f47b;内容专栏&#xff1a; C/C编程 &#x1f428;本文概括&#xff1a;list的介绍与使用、深度剖析及模拟实现。 &#x1f43c;本文作者&#xff1a; 阿四啊 &#x1f438;发布时间&#xff1a;2023.10.12 一、list的介绍与使用 1.1 list的介绍 cpluplus网站中有关…

fastjson-BCEL不出网打法原理分析

FastJson反序列化漏洞 与原生的 Java 反序列化的区别在于&#xff0c;FastJson 反序列化并未使用 readObject 方法&#xff0c;而是由 FastJson 自定一套反序列化的过程。通过在反序列化的过程中自动调用类属性的 setter 方法和 getter 方法&#xff0c;将JSON 字符串还原成对…

低代码提速应用开发

低代码介绍 低代码平台是指一种能够帮助企业快速交付业务应用的平台。自2000年以来&#xff0c;低代码市场一直充斥着40大大小小的各种玩家&#xff0c;比如国外的Appian、K2、Pega Systems、Salesforce和Ultimus&#xff0c;国内的H3 BPM。 2015年以后&#xff0c;这个市场更是…

《3D 数学基础》几何检测-相交性检测

目录 1. 2D直线相交 2. 3D射线相交点 3. 射线和平面的交点 4. 3个平面的交点 5. 射线和圆或者球交点 6. 两个圆或者球是否相交 7. 球和平面的相交性检测 8. 射线和AABB的相交性&#xff08;13.17&#xff09; 9. 射线和三角形的相交性&#xff08;13.16&#xff09; …

visual studio设置主题和背景颜色

visual studio2019默认的主题有4种&#xff0c;分别是浅白色、深黑色、蓝色、蓝(额外对比度)&#xff0c;背景颜色默认是纯白色RGB(255,255,255)。字体纯白色看久了&#xff0c;眼睛会感到酸痛、疲劳&#xff0c;建议改成浅白RGB(250,250,250)、豆沙绿RGB(85,123,105)、透明蓝白…

为什么要用回馈式电子负载

回馈式电子负载主要作用是模拟真实负载情况下的电流和电压变化&#xff0c;它在电子设备的开发、测试和调试过程中起到重要的作用。回馈式电子负载可以模拟各种负载条件&#xff0c;包括不同的电流和电压变化&#xff0c;这对于测试和验证电子设备的性能非常重要&#xff0c;可…

ios UI 基础开发一

目录 第一节&#xff1a;基础库 第二节&#xff1a;弹出模拟器的键盘 第三节&#xff1a;模拟器回到桌面 第四节&#xff1a;Viewcontroller 与 View 的关系 第五节&#xff1a;快捷键 第六节&#xff1a;键盘召回 ​第七节&#xff1a;启动流程xcode介绍 第八节&#xf…

英国金融科技公司【kennek】完成1250万美元融资

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 猛兽财经获悉&#xff0c;总部位于英国伦敦的金融科技公司kennek今日宣布已完成1250万美元种子轮融资。 本轮融资由HV Capital领投&#xff0c;荷兰创始人基金、AlbionVC、FFVC、Plug Play Ventures和Syndicate One参与。 …

java Maven入门笔记

后端Web开发技术的学习&#xff0c;我们要先学习Java项目的构建工具&#xff1a;Maven 目录 Maven概述Maven介绍及其作用Maven模型介绍Maven仓库Maven安装 IDEA集成Maven配置Maven环境当前工程设置全局设置 Maven项目创建Maven项目POM配置详解Maven坐标详解 导入Maven项目 依赖…

脂质代谢+预后模型+WGCNA+单细胞多种要素分析

今天给同学们分享一篇脂质代谢预后模型WGCNA单细胞的生信文章“A Novel Lipid Metabolism and Endoplasmic Reticulum Stress-Related Risk Model for Predicting Immune Infiltration and Prognosis in Colorectal Cancer”&#xff0c;这篇文章于2023年9月8日发表在Int Mol S…