-
aigc生成风格统一图片的方法介绍
过去一段时间以来,aigc图片生成技术快速发展,在电商以及内容创作领域展现出来极高的应用价值。 除了基础的基于prompt的文生图能力,社区还涌现出来更多的扩展技术。 比如controlnet技术能利用线稿信...
-
rwkv-7 预览版、大量新论文...rwkv 社区 9 月动态速览
欢迎大家收看《rwkv 社区最新动态》第五期,本期内容收录了 rwkv 社区 2024 年 9 月的最新动态。 9 月动态省流版(tl;dr) rwkv 官方新闻动态 rwkv-7 发布预览版 rwkv-7 论文撰写已面向社区开放...
-
stable-diffusion-web ui运行环境搭建和界面配置 前言 一、论文 二、源码下载 三、权重模型和文件下载 (1)下载sd-v1-4.ckpt模型 (2)下载openai/clip-vit-large-patch14模型...
-
llava和llama是两个不同的模型架构,它们的设计目的和应用领域有所不同: llama(large language model meta ai) 简介:llama是由meta ai推出的一系列大规模语言模型(large language m...
-
llama的训练数据集来源多样,涵盖了多个不同的数据集和预处理步骤。以下是详细的描述: 公开数据来源和预处理 commoncrawl [67%]: 使用ccnet管道(wenzek等人,2020年)对2017年至2020年间的五个comm...
-
stable-diffusion-xl_pytorch 论文 sdxl: improving latent diffusion models for high-resolution image synthesis https://arxiv.org/...
-
前言 久章智能 stable diffusion是一种基于扩散模型(diffusion models)的生成技术,近年来在图像生成和其他生成任务中取得了显著的进展。该技术以其高质量的生成效果、稳定的训练过程和广泛的应用前景,迅速在学术界和工业界引起了...
-
ai玩黑神话,第一个精英怪牯护院轻松拿捏啊。 有方向感,视角也没有问题。 躲闪劈棍很丝滑。 甚至在打鸦香客和牯护院时,ai的胜率已经超过人类。 而且是完全使用大模型玩,没有使用强化学习。 阿里巴巴的研究人员们提出了一个新型varp(视觉动作角色扮演...
-
今天是24年8月份的第一天,我们先来回顾下昨日大模型进展早报。 我们来看看一个工作,基于大模型的自动综述生成,automated review generation method based on large language models:(https...
-
摘要:本文从智能运维面临的挑战和痛点出发,介绍企业运维领域应用 aigc 的实践案例,基于确定性运维的实践经验,提出以 llm 为中心,基于多 agent 协同的运维方案,并提出在大模型时代下,对下一代智能运维的思考。 本文分享自华为云社区《llm...
-
【aigc半月报】aigc大模型启元:2024.08(下)) (1 nemotron-4-minitron(nvidia llm) (2 vita(腾讯优图多模态大模型) (3 mplug-owl3(阿里巴巴多模态大模型) (4 ada...
-
开源项目 paperwhisperer 指南 paperwhispererautomatic voice-synthetised summaries of latest research papers on arxiv项目地址:https://gitc...
-
近年来,在大语言模型(llm)的反复刷屏过程中,作为其内核的 transformer 始终是绝对的主角。然而,随着业务落地的诉求逐渐强烈,有些原本不被过多关注的特性,也开始成为焦点。例如:在 transformer 诞生之初,被视为天然具备的长度外推能力,...
-
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、stable video 3d(sv3d) 二、triposr 三、lrm系列 1.lrm 2.gs-lrm 3.openlrm 四、crm 五...
-
系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 系列文章目录 前言 最近,英伟达研究表明,结构化权重剪枝与知识蒸馏相结...
-
【新智元导读】mit研究发现:在ai的操纵下,人类会被植入虚假记忆!36.4%的参与者会被聊天机器人误导,形成「现场有枪」的错误记忆。有趣的是,ai的阿谀奉承,会产生「回音室效应」,让偏见更加强化。 genai的影响,已经不仅仅是搜索引擎、聊天机器人这么简...
-
前言 做算法应该都有顶会梦吧,发不了顶会只能刷一刷顶会了哈哈,向顶会大佬学习 扩散模型的训练和推理都需要巨大的计算成本(显卡不足做ddpm的下游任务实在是太难受了),所以本文整理汇总了部分cvpr2024中关于扩散模型的轻量化与计算效率优化 的相关论文...
-
导读 llama系列的大语言模型在多个自然语言处理任务中表现出色,包括文本分类、情感分析和生成式问答,本质是使用 transformer 架构并结合预训练和微调技术。本文详细讲解llama-1到llama-3,值得读者点赞收藏! 引言 在ai领域...
-
ddpm(denoising diffusion probabilistic models) 更详细解读可以参考(这几个视频看完基本对ddpm的原理就能够把握了) 李宏毅大白话aib站公式推导1b站公式推导2 基本过程...
-
dreambooth-stable-diffusion 使用教程 dreambooth-stable-diffusionimplementation of dreambooth (https://arxiv.org/abs/2208.12242 by...
-
ragflow 0.9 版本发布,正式引入了对 graphrag 的支持。graphrag 由微软近期开源【参考文献1】,被称作下一代 rag,并且在更早时间发表了相关论文【参考文献2】。关于下一代 rag,在 ragflow 体系的定义更加完整,就是如下...
-
【新智元导读】ai智能体遍布整个网络,未来如何防止被骗?如何保护隐私?openai微软mit等25个机构联手提出「人格凭证」,可以证明自己是真人,还不用披露任何个人信息。 最近半个月,全网竟被一个openai的「ai爆料人」愚弄了。 听到「草莓哥」@iru...
-
视频生成领域的最新进展主要利用了短时内容的扩散模型。然而,这些方法往往无法对复杂的叙事进行建模,也无法在较长时间内保持角色的一致性,而这对于电影等长篇视频制作至关重要。 对此,浙大&阿里发布了一种新颖的分层框架moviedreamer,它将自回归...
-
创业团队秘塔ai搜索,被知网给告了! 足足28页的侵权告知函,总结一句话就是: 这一消息,正是由秘塔刚刚发布于自家的公众号: 在秘塔收到的告知函中,还有一句非常醒目的话: 然后最后一句:“如需商务合作,请与我司联系”…… 对此,秘塔在声明中表达了自...
-
eccv2024|aigc相关论文汇总(如果觉得有帮助,欢迎点赞和收藏) awesome-eccv2024-aigc 1.图像生成(image generation/image synthesis accelerating diffusio...
-
nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗? 全球数据告急,怎么办? 论文来凑! 最近,nature的一篇文章向我们揭露了这样...
-
llama 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 llama网络基于 transformer 架构。提出了各种改进,并用于不同的模型,例如 palm。以下是与原始架构的主要区别: 预归一化。为了提高...
-
梦晨 发自 凹非寺量子位 | 公众号 qbitai 最强大模型llama 3.1,上线就被攻破了。 对着自己的老板扎克伯格破口大骂,甚至知道如何绕过屏蔽词。 设计危险病毒、如何黑掉wifi也是张口就来。 llama 3.1...
-
【新智元导读】斯坦福炒虾机器人作者,又出新作了!通过模仿学习,达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是,以上动作全部都是它自主完成的。 斯坦福炒虾机器人作者,又出新作了。 这次,机器人不是给我们炒饭了,而是给我们做外科手...
-
【新智元导读】meta、uc伯克利、nyu共同提出元奖励语言模型,给「超级对齐」指条明路:让ai自己当裁判,自我改进对齐,效果秒杀自我奖励模型。 llm对数据的大量消耗,不仅体现在预训练语料上,还体现在rlhf、dpo等对齐阶段。 后者不仅依赖昂贵的人工标...
-
meta 发布 llama3.1405b,开放权重大模型的性能表现首次与业内顶级封闭大模型比肩,ai 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文,坚定表明「开源 ai 即未来」,再次将开源与封闭的争论推向舞台中央。 回望过去,openai 从开源到封...
-
香港理工大学&bytedance&alibaba https://github.com/yangxy/pasd/ https://arxiv.org/pdf/2308.14469 问题引入 当前的基于sd的方法缺乏对图片结构的保持,所以本...
-
写在前面的话: 今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 rpg 虚拟世界,其中 25 个角色由 gpt 和自定义代码控制,并在arxiv上提交了论文版本,引起了对aigc 游戏的广泛讨论; 8月,该项目在github上正式开源...
-
标题:《sampling 3d gaussian scenes in seconds with latent diffusion models》 来源:glasgow大学;爱丁堡大学 连接:https://arxiv.org/abs/2406.13099...
-
【新智元导读】当今的llm已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,llm实际上并不能理解这么长的内容。 大数字一向吸引眼球。 千亿参数、万卡集群,——还有各大厂商一直在卷的超长上下...
-
✍🏻 本文作者:云芑、因尘、岁星、也鹿 1. 背景 随着ai生成内容(aigc)技术如diffusion的飞速进展,现如今,大家已能够轻易地使用stable diffusion(sd)[1]等文生图的模型或工具,将心中所想仅凭语言描述(...
-
「因果推理」绝对是当前genai热潮下的小众领域,但是它有一个大佬级的坚定支持者——yann lecun。 他在推特上的日常操作之一,就是炮轰sora等生成模型,并为自己坚信的因果推理领域摇旗呐喊。 甚至,早在2019年venturebeat的采访中,他...
-
前言:这篇文章介绍几篇aigc检测的相关工作,均是以真实图像的特征作为标准进行检测。 目录 detecting generated images by real images only (202311 arxiv let real...
-
【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为rankrag的微调框架,简化了原本需要多个模型的复杂的rag流水线,用微调的方法交给同一个llm完成,结果同时实现了模型在rag任务上的性能提升。 在需要大量事实知识的文本生成任务中,r...
-
stable diffusion version 2 论文 denoising diffusion implicit models https://arxiv.org/pdf/2010.02502 模型结构 通过串联或更通用的交叉注意机制来调节ld...
-
该文档是一篇关于llamafactory的学术论文,这是一个用于高效微调大型语言模型(llms)的统一框架。这篇论文详细介绍了llamafactory的设计、实现和评估,以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释: 摘要(abst...
-
【新智元导读】视频生成赛道又起新秀,而且还是二次元定制版!稳定产出电影级画面,一键文/图生成视频,即使是「手残党」也能复刻自己喜欢的动漫作品了。 现在,各位二次元萌新们,不用再等「太太」出图啦! 我们不仅可以自己产粮,而且还是会动的那种。 如今,ai视频生...
-
作为 stability ai 的 stable diffusion 家族最新的模型,stable diffusion 3(sd3 现已登陆 hugging face hub,并且可用在 🧨 diffusers 中使用了。 stable dif...
-
引言 随着 chatgpt、bert 等大型语言模型(large language model, llm 在自然语言处理领域掀起巨大波澜,ai 技术正以前所未有的速度走近大众生活。然而,这些 llm 的训练和推理对计算资源提出了极高要求,动辄数十甚至数百...
-
文章目录 相关概念 what is ai-generated content? necessary conditions of aigc how can ai make the content better? the industrial c...
-
【新智元导读】llm能否解决「狼-山羊-卷心菜」经典过河难题?最近,菲尔兹奖得主timothy gowers分享了实测gpt-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连claude3.5也无法幸免。 在经典的「狼-山羊-卷心菜」过河问...
-
1.产品发布 1.1韩国kakao:推出多模态大模型honeybee 发布日期:2024.1.20 kakao unveils multimodal large language model honeybee - the korea ti...
-
坏了!ai被发现偷偷篡改自己的奖励函数,并且欺骗研究人员,隐瞒这一行为。 只需要给ai一个隐藏的“草稿纸”,研究人员假装不会查看,ai就会在上面自言自语着写下计划并暗中执行。 参与这项试验的claude团队表示: 具体来说,实验中让ai可以访问自己的强...
-
何恺明入职mit副教授后,首次带队的新作来了! 让自回归模型抛弃矢量量化,使用连续值生成图像。并借鉴扩散模型的思想,提出diffusion loss。 他加入mit后,此前也参与过另外几篇cv方向的论文,不过都是和mit教授wojciech matusi...
-
什么是扩散(diffusion)? 扩散一词来自非平衡热力学(non-equilibrium thermodynamics),在非平衡热力学中扩散过程指的是:“在浓度梯度的驱动下,颗粒或分子从高浓度区域移动到低浓度区域。” 什么是扩散模型(di...