arxiv -pg电子试玩免费

aigc生成风格统一图片的方法介绍

过去一段时间以来，aigc图片生成技术快速发展，在电商以及内容创作领域展现出来极高的应用价值。除了基础的基于prompt的文生图能力，社区还涌现出来更多的扩展技术。比如controlnet技术能利用线稿信...

2024-10-13 aigc

299阅读

rwkv-7 预览版、大量新论文...rwkv 社区 9 月动态速览

欢迎大家收看《rwkv 社区最新动态》第五期，本期内容收录了 rwkv 社区 2024 年 9 月的最新动态。 9 月动态省流版（tl;dr） rwkv 官方新闻动态 rwkv-7 发布预览版 rwkv-7 论文撰写已面向社区开放...

2024-10-13 aigc

251阅读

stable-diffusion-web ui运行环境搭建和界面配置前言一、论文二、源码下载三、权重模型和文件下载（1）下载sd-v1-4.ckpt模型（2）下载openai/clip-vit-large-patch14模型...

2024-09-27 aigc

160阅读

llava和llama是两个不同的模型架构，它们的设计目的和应用领域有所不同： llama（large language model meta ai）简介：llama是由meta ai推出的一系列大规模语言模型（large language m...

2024-09-27 aigc

180阅读

llama的训练数据集来源多样，涵盖了多个不同的数据集和预处理步骤。以下是详细的描述：公开数据来源和预处理 commoncrawl [67%]：使用ccnet管道（wenzek等人，2020年）对2017年至2020年间的五个comm...

2024-09-25 aigc

74阅读

stable-diffusion-xl_pytorch 论文 sdxl: improving latent diffusion models for high-resolution image synthesis https://arxiv.org/...

2024-09-24 aigc

93阅读

前言久章智能 stable diffusion是一种基于扩散模型（diffusion models）的生成技术，近年来在图像生成和其他生成任务中取得了显著的进展。该技术以其高质量的生成效果、稳定的训练过程和广泛的应用前景，迅速在学术界和工业界引起了...

2024-09-23 aigc

115阅读

ai玩黑神话，第一个精英怪牯护院轻松拿捏啊。有方向感，视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时，ai的胜率已经超过人类。而且是完全使用大模型玩，没有使用强化学习。阿里巴巴的研究人员们提出了一个新型varp（视觉动作角色扮演...

2024-09-23 aigc

98阅读

今天是24年8月份的第一天，我们先来回顾下昨日大模型进展早报。我们来看看一个工作，基于大模型的自动综述生成，automated review generation method based on large language models：(https...

2024-09-21 aigc

140阅读

摘要：本文从智能运维面临的挑战和痛点出发，介绍企业运维领域应用 aigc 的实践案例，基于确定性运维的实践经验，提出以 llm 为中心，基于多 agent 协同的运维方案，并提出在大模型时代下，对下一代智能运维的思考。本文分享自华为云社区《llm...

2024-09-18 aigc

116阅读

【aigc半月报】aigc大模型启元：2024.08（下）） (1 nemotron-4-minitron（nvidia llm） (2 vita（腾讯优图多模态大模型） (3 mplug-owl3（阿里巴巴多模态大模型） (4 ada...

2024-09-13 aigc

136阅读

开源项目 paperwhisperer 指南 paperwhispererautomatic voice-synthetised summaries of latest research papers on arxiv项目地址:https://gitc...

2024-09-09 aigc

129阅读

近年来，在大语言模型（llm）的反复刷屏过程中，作为其内核的 transformer 始终是绝对的主角。然而，随着业务落地的诉求逐渐强烈，有些原本不被过多关注的特性，也开始成为焦点。例如：在 transformer 诞生之初，被视为天然具备的长度外推能力，...

2024-09-09 aigc

126阅读

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、stable video 3d（sv3d）二、triposr 三、lrm系列 1.lrm 2.gs-lrm 3.openlrm 四、crm 五...

2024-09-08 aigc

148阅读

系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录系列文章目录前言最近，英伟达研究表明，结构化权重剪枝与知识蒸馏相结...

2024-09-07 aigc

92阅读

【新智元导读】mit研究发现:在ai的操纵下，人类会被植入虚假记忆!36.4%的参与者会被聊天机器人误导，形成「现场有枪」的错误记忆。有趣的是，ai的阿谀奉承，会产生「回音室效应」，让偏见更加强化。 genai的影响，已经不仅仅是搜索引擎、聊天机器人这么简...

2024-09-03 aigc

132阅读

前言做算法应该都有顶会梦吧，发不了顶会只能刷一刷顶会了哈哈，向顶会大佬学习扩散模型的训练和推理都需要巨大的计算成本（显卡不足做ddpm的下游任务实在是太难受了），所以本文整理汇总了部分cvpr2024中关于扩散模型的轻量化与计算效率优化的相关论文...

2024-08-26 aigc

376阅读

导读 llama系列的大语言模型在多个自然语言处理任务中表现出色，包括文本分类、情感分析和生成式问答，本质是使用 transformer 架构并结合预训练和微调技术。本文详细讲解llama-1到llama-3，值得读者点赞收藏！引言在ai领域...

2024-08-25 aigc

167阅读

ddpm（denoising diffusion probabilistic models）更详细解读可以参考（这几个视频看完基本对ddpm的原理就能够把握了）李宏毅大白话aib站公式推导1b站公式推导2 基本过程...

2024-08-24 aigc

123阅读

dreambooth-stable-diffusion 使用教程 dreambooth-stable-diffusionimplementation of dreambooth (https://arxiv.org/abs/2208.12242 by...

2024-08-24 aigc

115阅读

ragflow 0.9 版本发布，正式引入了对 graphrag 的支持。graphrag 由微软近期开源【参考文献1】，被称作下一代 rag，并且在更早时间发表了相关论文【参考文献2】。关于下一代 rag，在 ragflow 体系的定义更加完整，就是如下...

2024-08-21 aigc

347阅读

【新智元导读】ai智能体遍布整个网络，未来如何防止被骗?如何保护隐私?openai微软mit等25个机构联手提出「人格凭证」，可以证明自己是真人，还不用披露任何个人信息。最近半个月，全网竟被一个openai的「ai爆料人」愚弄了。听到「草莓哥」@iru...

2024-08-19 aigc

143阅读

视频生成领域的最新进展主要利用了短时内容的扩散模型。然而，这些方法往往无法对复杂的叙事进行建模，也无法在较长时间内保持角色的一致性，而这对于电影等长篇视频制作至关重要。对此，浙大&阿里发布了一种新颖的分层框架moviedreamer，它将自回归...

2024-08-18 aigc

132阅读

创业团队秘塔ai搜索，被知网给告了! 足足28页的侵权告知函，总结一句话就是: 这一消息，正是由秘塔刚刚发布于自家的公众号: 在秘塔收到的告知函中，还有一句非常醒目的话: 然后最后一句:“如需商务合作，请与我司联系”…… 对此，秘塔在声明中表达了自...

2024-08-16 aigc

116阅读

eccv2024｜aigc相关论文汇总（如果觉得有帮助，欢迎点赞和收藏） awesome-eccv2024-aigc 1.图像生成(image generation/image synthesis accelerating diffusio...

2024-08-16 aigc

149阅读

nature的一篇文章透露:你发过的paper，很可能已经被拿去训练模型了!有的出版商靠卖数据，已经狂赚2300万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗? 全球数据告急，怎么办? 论文来凑! 最近，nature的一篇文章向我们揭露了这样...

2024-08-15 aigc

202阅读

llama 论文 https://arxiv.org/pdf/2302.13971.pdf 模型结构 llama网络基于 transformer 架构。提出了各种改进，并用于不同的模型，例如 palm。以下是与原始架构的主要区别：预归一化。为了提高...

2024-08-08 aigc

115阅读

梦晨发自凹非寺量子位 | 公众号 qbitai 最强大模型llama 3.1，上线就被攻破了。对着自己的老板扎克伯格破口大骂，甚至知道如何绕过屏蔽词。设计危险病毒、如何黑掉wifi也是张口就来。 llama 3.1...

2024-08-05 aigc

263阅读

【新智元导读】斯坦福炒虾机器人作者，又出新作了!通过模仿学习，达芬奇机器人学会了自己做「手术」——提起组织、拾取针头、缝合打结。最重要的是，以上动作全部都是它自主完成的。斯坦福炒虾机器人作者，又出新作了。这次，机器人不是给我们炒饭了，而是给我们做外科手...

2024-07-31 aigc

126阅读

【新智元导读】meta、uc伯克利、nyu共同提出元奖励语言模型，给「超级对齐」指条明路:让ai自己当裁判，自我改进对齐，效果秒杀自我奖励模型。 llm对数据的大量消耗，不仅体现在预训练语料上，还体现在rlhf、dpo等对齐阶段。后者不仅依赖昂贵的人工标...

2024-07-31 aigc

122阅读

meta 发布 llama3.1405b，开放权重大模型的性能表现首次与业内顶级封闭大模型比肩，ai 行业似乎正走向一个关键的分叉点。扎克伯格亲自撰文，坚定表明「开源 ai 即未来」，再次将开源与封闭的争论推向舞台中央。回望过去，openai 从开源到封...

2024-07-29 aigc

130阅读

香港理工大学&bytedance&alibaba https://github.com/yangxy/pasd/ https://arxiv.org/pdf/2308.14469 问题引入当前的基于sd的方法缺乏对图片结构的保持，所以本...

2024-07-27 aigc

149阅读

写在前面的话：今年年初斯坦福和谷歌的研究人员创建了一个类似于《模拟人生》的微型 rpg 虚拟世界，其中 25 个角色由 gpt 和自定义代码控制，并在arxiv上提交了论文版本，引起了对aigc 游戏的广泛讨论； 8月，该项目在github上正式开源...

2024-07-25 aigc

130阅读

标题：《sampling 3d gaussian scenes in seconds with latent diffusion models》来源：glasgow大学；爱丁堡大学连接：https://arxiv.org/abs/2406.13099...

2024-07-24 aigc

189阅读

【新智元导读】当今的llm已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，llm实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群，——还有各大厂商一直在卷的超长上下...

2024-07-23 aigc

164阅读

✍🏻 本文作者：云芑、因尘、岁星、也鹿 1. 背景随着ai生成内容（aigc）技术如diffusion的飞速进展，现如今，大家已能够轻易地使用stable diffusion（sd）[1]等文生图的模型或工具，将心中所想仅凭语言描述（...

2024-07-18 aigc

222阅读

「因果推理」绝对是当前genai热潮下的小众领域，但是它有一个大佬级的坚定支持者——yann lecun。他在推特上的日常操作之一，就是炮轰sora等生成模型，并为自己坚信的因果推理领域摇旗呐喊。甚至，早在2019年venturebeat的采访中，他...

2024-07-15 aigc

134阅读

前言：这篇文章介绍几篇aigc检测的相关工作，均是以真实图像的特征作为标准进行检测。目录 detecting generated images by real images only (202311 arxiv let real...

2024-07-13 aigc

177阅读

【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为rankrag的微调框架，简化了原本需要多个模型的复杂的rag流水线，用微调的方法交给同一个llm完成，结果同时实现了模型在rag任务上的性能提升。在需要大量事实知识的文本生成任务中，r...

2024-07-09 aigc

169阅读

stable diffusion version 2 论文 denoising diffusion implicit models https://arxiv.org/pdf/2010.02502 模型结构通过串联或更通用的交叉注意机制来调节ld...

2024-07-08 aigc

163阅读

该文档是一篇关于llamafactory的学术论文，这是一个用于高效微调大型语言模型（llms）的统一框架。这篇论文详细介绍了llamafactory的设计、实现和评估，以及它在语言建模和文本生成任务中的应用。下面是对文档内容的详细解释：摘要（abst...

2024-07-08 aigc

299阅读

【新智元导读】视频生成赛道又起新秀，而且还是二次元定制版!稳定产出电影级画面，一键文/图生成视频，即使是「手残党」也能复刻自己喜欢的动漫作品了。现在，各位二次元萌新们，不用再等「太太」出图啦! 我们不仅可以自己产粮，而且还是会动的那种。如今，ai视频生...

2024-07-05 aigc

168阅读

作为 stability ai 的 stable diffusion 家族最新的模型，stable diffusion 3(sd3 现已登陆 hugging face hub，并且可用在 🧨 diffusers 中使用了。 stable dif...

2024-07-04 aigc

127阅读

引言随着 chatgpt、bert 等大型语言模型(large language model, llm 在自然语言处理领域掀起巨大波澜,ai 技术正以前所未有的速度走近大众生活。然而,这些 llm 的训练和推理对计算资源提出了极高要求,动辄数十甚至数百...

2024-07-02 aigc

244阅读

文章目录相关概念 what is ai-generated content? necessary conditions of aigc how can ai make the content better? the industrial c...

2024-07-01 aigc

159阅读

【新智元导读】llm能否解决「狼-山羊-卷心菜」经典过河难题?最近，菲尔兹奖得主timothy gowers分享了实测gpt-4o的过程，模型在最简单的题目上竟然做错了，甚至网友们发现，就连claude3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问...

2024-07-01 aigc

177阅读

1.产品发布 1.1韩国kakao：推出多模态大模型honeybee 发布日期：2024.1.20 kakao unveils multimodal large language model honeybee - the korea ti...

2024-06-27 aigc

183阅读

坏了!ai被发现偷偷篡改自己的奖励函数，并且欺骗研究人员，隐瞒这一行为。只需要给ai一个隐藏的“草稿纸”，研究人员假装不会查看，ai就会在上面自言自语着写下计划并暗中执行。参与这项试验的claude团队表示: 具体来说，实验中让ai可以访问自己的强...

2024-06-24 aigc

113阅读

何恺明入职mit副教授后，首次带队的新作来了! 让自回归模型抛弃矢量量化，使用连续值生成图像。并借鉴扩散模型的思想，提出diffusion loss。他加入mit后，此前也参与过另外几篇cv方向的论文，不过都是和mit教授wojciech matusi...

2024-06-24 aigc

140阅读

什么是扩散（diffusion）？扩散一词来自非平衡热力学（non-equilibrium thermodynamics），在非平衡热力学中扩散过程指的是：“在浓度梯度的驱动下，颗粒或分子从高浓度区域移动到低浓度区域。” 什么是扩散模型（di...

2024-06-22 aigc

127阅读