lyogavin/Anima

第一个开源的基于QLoRA的33B中文大语言模型First QLoRA based open source 33B Chinese LLM

Jupyter NotebookPythonShellopen-sourcechinese-nlpllamalorainstruction-setfinetuneopen-source-modelsopen-modelsllmgenerative-aiinstruct-gptqlorachinese-llm

Stars and forks stats for /lyogavin/Anima

65 forks on 2023-06-2665 forks on 2023-06-2769 forks on 2023-06-2869 forks on 2023-06-2971 forks on 2023-06-3071 forks on 2023-07-0172 forks on 2023-07-0272 forks on 2023-07-0376 forks on 2023-07-0477 forks on 2023-07-0580 forks on 2023-07-0687 forks on 2023-07-0792 forks on 2023-07-0892 forks on 2023-07-0992 forks on 2023-07-1092 forks on 2023-07-1192 forks on 2023-07-1293 forks on 2023-07-1394 forks on 2023-07-1494 forks on 2023-07-1594 forks on 2023-07-1696 forks on 2023-07-1796 forks on 2023-07-1896 forks on 2023-07-1997 forks on 2023-07-2097 forks on 2023-07-2197 forks on 2023-07-2297 forks on 2023-07-2397 forks on 2023-07-2497 forks on 2023-07-2598 forks on 2023-07-2698 forks on 2023-07-2798 forks on 2023-07-2898 forks on 2023-07-2998 forks on 2023-07-3098 forks on 2023-07-3198 forks on 2023-08-0199 forks on 2023-08-0299 forks on 2023-08-0399 forks on 2023-08-0499 forks on 2023-08-0599 forks on 2023-08-0699 forks on 2023-08-0799 forks on 2023-08-0899 forks on 2023-08-0999 forks on 2023-08-1099 forks on 2023-08-1199 forks on 2023-08-1299 forks on 2023-08-1399 forks on 2023-08-14100 forks on 2023-08-15100 forks on 2023-08-16100 forks on 2023-08-17101 forks on 2023-08-18101 forks on 2023-08-19101 forks on 2023-08-20101 forks on 2023-08-21101 forks on 2023-08-22101 forks on 2023-08-23101 forks on 2023-08-24102 forks on 2023-08-25102 forks on 2023-08-26102 forks on 2023-08-27102 forks on 2023-08-28102 forks on 2023-08-29103 forks on 2023-08-30103 forks on 2023-08-31103 forks on 2023-09-01103 forks on 2023-09-02103 forks on 2023-09-03103 forks on 2023-09-04103 forks on 2023-09-05103 forks on 2023-09-06103 forks on 2023-09-07103 forks on 2023-09-08103 forks on 2023-09-09103 forks on 2023-09-10103 forks on 2023-09-11104 forks on 2023-09-12104 forks on 2023-09-13104 forks on 2023-09-14105 forks on 2023-09-15105 forks on 2023-09-16106 forks on 2023-09-17106 forks on 2023-09-18105 forks on 2023-09-19105 forks on 2023-09-20105 forks on 2023-09-21105 forks on 2023-09-22105 forks on 2023-09-23

105forks in total +65last 90 days

465 stars on 2023-06-26506 stars on 2023-06-27512 stars on 2023-06-28515 stars on 2023-06-29530 stars on 2023-06-30537 stars on 2023-07-01539 stars on 2023-07-02556 stars on 2023-07-03615 stars on 2023-07-04688 stars on 2023-07-05771 stars on 2023-07-06820 stars on 2023-07-07848 stars on 2023-07-08852 stars on 2023-07-09852 stars on 2023-07-10876 stars on 2023-07-11876 stars on 2023-07-12889 stars on 2023-07-13905 stars on 2023-07-14967 stars on 2023-07-151 011 stars on 2023-07-161 016 stars on 2023-07-171 019 stars on 2023-07-181 026 stars on 2023-07-191 033 stars on 2023-07-201 033 stars on 2023-07-211 036 stars on 2023-07-221 039 stars on 2023-07-231 045 stars on 2023-07-241 051 stars on 2023-07-251 052 stars on 2023-07-261 057 stars on 2023-07-271 060 stars on 2023-07-281 065 stars on 2023-07-291 068 stars on 2023-07-301 067 stars on 2023-07-311 068 stars on 2023-08-011 072 stars on 2023-08-021 072 stars on 2023-08-031 073 stars on 2023-08-041 075 stars on 2023-08-051 077 stars on 2023-08-061 077 stars on 2023-08-071 080 stars on 2023-08-081 080 stars on 2023-08-091 085 stars on 2023-08-101 087 stars on 2023-08-111 088 stars on 2023-08-121 088 stars on 2023-08-131 088 stars on 2023-08-141 094 stars on 2023-08-151 095 stars on 2023-08-161 098 stars on 2023-08-171 102 stars on 2023-08-181 102 stars on 2023-08-191 102 stars on 2023-08-201 102 stars on 2023-08-211 104 stars on 2023-08-221 106 stars on 2023-08-231 111 stars on 2023-08-241 113 stars on 2023-08-251 114 stars on 2023-08-261 114 stars on 2023-08-271 115 stars on 2023-08-281 115 stars on 2023-08-291 118 stars on 2023-08-301 119 stars on 2023-08-311 119 stars on 2023-09-011 119 stars on 2023-09-021 119 stars on 2023-09-031 119 stars on 2023-09-041 122 stars on 2023-09-051 127 stars on 2023-09-061 132 stars on 2023-09-071 133 stars on 2023-09-081 133 stars on 2023-09-091 133 stars on 2023-09-101 134 stars on 2023-09-111 135 stars on 2023-09-121 137 stars on 2023-09-131 137 stars on 2023-09-141 140 stars on 2023-09-151 163 stars on 2023-09-161 197 stars on 2023-09-171 205 stars on 2023-09-181 217 stars on 2023-09-191 217 stars on 2023-09-201 220 stars on 2023-09-211 223 stars on 2023-09-221 228 stars on 2023-09-23

1.2kstars in total +1.1klast 90 days

This is stars and forks stats for /lyogavin/Anima repository. As of 23 Sep, 2023 this repository has 1228 stars and 105 forks.

Anima 第一个开源的基于QLoRA的33B中文大语言模型,支持了基于DPO的对齐训练。 我们也开源了100K输入窗口的开源模型Anima100K,基于Llama2,可商用。 Read this in English. 🔄 更新 [2023/09/06] 更新支持100k 上下文的基于Llama2的可商用大模型 [2023/06/29] 更新基于DPO+QLoRA的Human Feedback训练 [2023/06/12] 开源了第一个基于QLoRA的中文33B大语言模型 Anima 33B中文 因此我们认为QLoRA 的工作很重要,重要到可能是个Game Changer。通过QLoRA的优化方法,第一次让33B规模的模型可以比较民主化的,比较低成本的finetune训练,并且普及使用。我们认为33B模型既可以发挥大规模模型的比较强的reasoning能力,又可以针对私有业务领域数据进行灵活的finetune训练提升对于LLM的控制力。 具体详见:这里。 基于QLoRA的DPO RLHF实现 Anima模型又开源了基于QLoRA的最新的DPO技术。 DPO是最新的最高效的RLHF训练方法。RLHF一直是生成式AI训练的老大难问题,也被认为是OpenAI的压箱底独家秘笈。DPO技术改变了这一切,让RLHF彻底傻瓜化! 我们开源了RLHF的低成本QLoRA的实现,一台GPU机器就可以训练33B模型的DPO! 具体详见:这里。 支持100K输入长度的开源大语言模型 当输入长度支持100k,你甚至可以把整个知识库都放入Prompt交给模型。或者可以把一本书直接放到Prompt里边。再也不用各种费劲的向量化,文本分割。。。。 我们堆了各种最新的猛料:XEntropy,Paged 8bit Adamw, LORA, Flashattention2,并且专门针对长输入对于training和Inference代码都做了修改定制,使得单卡100G就可以训练100k窗口。单卡40G就可以进行推理。 训练数据上,从几十种公开数据集中精选了专门针对长输入的30k~100k长度的长文本训练数据,专门针对100K输入对模型进行了训练。 具体详见:这里。 微信公众号 扫码: 微信群 扫码进群: 参与贡献 欢迎大家参与贡献本项目 🙏 如果你喜欢我们的项目,请帮忙点个⭐吧! ✍️ 艾写科技 此工作来自于艾写科技。我们团队来自于硅谷,有多年中、美大厂的一线AI工作经验。 我们致力于通过最新的AGI,LLM技术为内容创作提供下一代的内容创作工具。欢迎试用我们的产品。
Read on GithubGithub Stats Page
repotechsstarsweeklyforksweekly
tatsu-lab/alpaca_evalJupyter NotebookPython6230850
radkesvat/ReverseTlsTunnelNimShell197+1433+8
facebookresearch/ijepaPython2.2k03660
Victorwz/LongMemPythonShellCuda64401040
uzh-rpg/RVTPython2230280
sinsinology/CVE-2023-20887RubyPython2180450
spyglass-search/spyglassRustHTMLJavaScript2.2k0460
matter-labs/zksync-docsShell29903290
aorumbayev/autogpt4allPythonShell3320460
openSIL/openSILCPythonAssembly2470160