transformer series llm

cleaning of llm corpus 大模型语料清洗

cleaning of llm corpus 大模型语料清洗数据是人工智能领域发展的基础要素之一。随着大规模预训练模型及相关技术不断取得突破，在相应研究中使用高效数据处理工具提升数据质量变得越来越重要。llm_corpus_quality集成了包含清洗、敏感词过滤、广告词过滤、语料质量自动评估等功 ......

语料 cleaning 模型 corpus llm更新时间 2024-01-13

CF1506D - Epic Transformation

思路用优先队列模拟 ac代码 #include <bits/stdc++.h> using namespace std; using i64 = long long; const i64 inf = 8e18; typedef pair<int, int> pii; const int N = 5 ......

Transformation 1506D 1506 Epic CF更新时间 2024-01-13

LLM series: Transformer

🥥 Homepage Dataset, DataLoader, and Transforms Model Traning Model 🥑 Get Started! Import libraries: import torch import torch.nn as nn import torch. ......

Transformer series LLM更新时间 2024-01-12

大语言模型LLM幻觉的解决方法：检索增强生成RAG

当你向大语言模型LLMs集成的问答系统平台咨询医疗方面的问题，比如呼吸道感染应该怎么治疗，它可能直接给出答案，但不会提供这个答案的依据来源，这是因为大语言模型应用过程中还存在答案透明度不足的缺陷导致。此外，大语言模型还有知识更新的滞后性、在处理复杂任务时的准确性的问题。为了解决这些问题，检索增强生 ......

幻觉模型语言方法 LLM更新时间 2024-01-11

Learning Dynamic Query Combinations for Transformer-based Object** Detection and Segmentation论文阅读笔记

Motivation & Intro 基于DETR的目标检测范式（语义分割的Maskformer也与之相似）通常会用到一系列固定的query，这些query是图像中目标对象位置和语义的全局先验。如果能够根据图像的语义信息调整query，就可以捕捉特定场景中物体位置和类别的分布。例如，当高级语义显示图 ......

Transformer-based Combinations Segmentation Transformer Detection更新时间 2024-01-11

[NLP复习笔记] Transformer

1. Transformer 概述 1.1 整体结构 \(\text{Transformer}\) 主要由 \(\text{Encoder}\) 和 \(\text{Decoder}\) 两个部分组成。\(\text{Encoder}\) 部分有 \(N = 6\) 个相同的层，每层包含一个 \( ......

Transformer 笔记 NLP更新时间 2024-01-11

使用CLIP和LLM构建多模态RAG系统

使用CLIP和LLM构建多模态RAG系统在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal)构建检索增强生成(RAG)系统。本文的重点是在不依赖LangChain或LLlama index的情况下实现这一目标，这样可以避免更多的框架依赖。什么是RA ......

模态系统 CLIP LLM RAG更新时间 2024-01-11

RNN 和 Transformer 复杂度比较

这里假设BatchSize为 1，就是单样本的情况。原始 RNN 块：（1）单步计算 H，包含两个矩阵向量乘法，和一个激活，复杂度HidSize² （2）一共有SeqLen步，所以整体复杂度SeqLen * HidSize² LSTM 块：（1）单步计算 F I C_hat O，包含八个矩阵向 ......

复杂度 Transformer RNN更新时间 2024-01-09

挑战Transformer的新架构Mamba解析以及Pytorch复现

今天我们来详细研究这篇论文“Mamba:具有选择性状态空间的线性时间序列建模” Mamba一直在人工智能界掀起波澜，被吹捧为Transformer的潜在竞争对手。到底是什么让Mamba在拥挤的序列建中脱颖而出? 在介绍之前先简要回顾一下现有的模型 Transformer:以其注意力机制而闻名，其中序 ......

Transformer 架构 Pytorch Mamba更新时间 2024-01-09

《Span-Based Joint Entity and Relation Extraction with Transformer Pre-Training》阅读笔记

代码原文地址预备知识： 1.什么是束搜索算法（beam search）? beam search是一种用于许多自然语言处理和语音识别模型的算法，作为最终决策层，用于在给定目标变量(如最大概率或下一个输出字符)的情况下选择最佳输出。 2.什么是条件随机场（Conditional Random Fi ......

Pre-Training Transformer Span-Based Extraction Relation更新时间 2024-01-08

[Debug Series] Don't capture reference unless it's transient

This article discusses potential bugs caused by lambda's capture synatax, and warns the reader, before acutally capturing by reference, they should co... ......

reference transient capture Series unless更新时间 2024-01-07

面向初学者的机器学习、数据科学、AI、LLM课程统统免费

微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费大家好，我是老章推荐几个质量上乘且完全免费的微软开源课程面向初学者的机器学习课程地址：https://microsoft.github.io/ML ......

初学者机器课程科学数据更新时间 2024-01-06

LLM增强LLM；通过预测上下文来提高文生图质量；Spikformer V2；同时执行刚性和非刚性编辑的通用图像编辑框架

文章首发于公众号：机器感知 LLM增强LLM；通过预测上下文来提高文生图质量；Spikformer V2；同时执行刚性和非刚性编辑的通用图像编辑框架 LLM Augmented LLMs: Expanding Capabilities through Composition 本文研究了如何高效地组合 ......

刚性图像编辑上下文 Spikformer LLM更新时间 2024-01-05

ICLR 2022: Anomaly Transformer论文阅读笔记+代码复现

本论文全名为Anomaly Transformer: Time Series Anomaly Detection with Association Descrepancy（通过关联差异进行时序异常检测），主要提出了一种无监督的异常点检测算法，并在6个benchmarks上测试，获取良好结果。论文链 ......

Transformer Anomaly 代码笔记论文更新时间 2024-01-05

概率霍夫变换（Progressive Probabilistic Hough Transform）原理详解

概率霍夫变换（Progressive Probabilistic Hough Transform）的原理很简单，如下所述： 1.随机获取边缘图像上的前景点，映射到极坐标系画曲线； 2.当极坐标系里面有交点达到最小投票数，将该点对应x-y坐标系的直线L找出来； 3.搜索边缘图像上前景点，在直线L上的点 ......

Probabilistic 概率 Progressive Transform 原理更新时间 2024-01-03

如何避免LLM的“幻觉”(Hallucination)

生成式大语言模型（LLM）可以针对各种用户的 prompt 生成高度流畅的回复。然而，大模型倾向于产生幻觉或做出非事实陈述，这可能会损害用户的信任。大语言模型的长而详细的输出看起来很有说服力，但是这些输出很有可能是虚构的。这是否意味着我们不能信任聊天机器人，每次都必须手动检查输出的事实?有一些方法 ......

Hallucination 幻觉 LLM更新时间 2024-01-03

5、flink任务中可以使用哪些转换算子（Transformation）

5、flink任务中可以使用哪些转换算子（Transformation） <div id="content_views" class="htmledit_views"> <h1>1、什么是Flink中的转换算子</h1> 在使用 Flink DataStream API 开发流式计算任务时，可以将一 ......

算子 Transformation 任务 flink更新时间 2024-01-03

微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费

微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费大家好，我是老章推荐几个质量上乘且完全免费的微软开源课程面向初学者的机器学习课程地址：https://microsoft.github.io/ML-For-Beginners/#/ 学习经典机器学习，主要使用 Sciki ......

活菩萨初学者机器课程科学更新时间 2024-01-02

一文读懂大型语言模型LLM

在当今的技术世界中，人工智能正以前所未有的速度发展和演变。这一领域的快速发展得益于先进的机器学习算法、海量数据的可用性以及计算能力的显著提升。特别是，在自然语言处理（NLP）领域，AI的进步已经让计算机不仅能理解人类语言的基本结构，还能在更深层次上把握其语义和情感。这种能力的核心在于大型语言模型（大 ......

模型语言 LLM更新时间 2024-01-02

打通Rasa Action Server和LLM接口的尝试方法

本文使用最简单的方法对打通 Rasa Action Server 和 LLM 接口进行了尝试，即当 Rasa 对话 intent 为 out_of_scope 时，调用 action_gpt_fallback 的 action，在 action 中根据 tracker.latest_message. ......

接口方法 Action Server Rasa更新时间 2024-01-01

解密Prompt系列22. LLM Agent之RAG的反思：放弃了压缩还是智能么？

当前RAG多数只让模型基于检索内容回答，其实限制了模型自身知识压缩形成的智能。既要事实性又要模型智能，需要最大化使用模型内化到参数中的信息，只在必要时调用外部知识，这里介绍前置和后置处理的几种方案~ ......

还是智能 Prompt Agent LLM更新时间 2024-01-01

Visual Transformer 与归纳偏置

开端 ViT（Visual Transformer）是 2020 年 Google 团队提出的将 Transformer 应用在图像分类的模型，但是当训练数据集不够大的时候，ViT 的表现通常比同等大小的 ResNets 要差一些。为什么呢？寻找答案的过程中，发现了归纳偏置这个概念。在阅读 ......

Transformer Visual更新时间 2023-12-31

LLM 系列

LLM prompt 大模型微调-综述大模型微调-Prompt Tuning 大模型微调 - LoRA 系列大模型微调 - Prefix Tuning / P-Tuning v2 RAG Embedding Embedding 模型收录 embedding - bi encode AND cro ......

LLM更新时间 2023-12-30

transformers 系列

Attention 注意力机制【1】-入门篇注意力机制【2】- CV中的注意力机制注意力机制【3】-Self Attention 注意力机制【4】-多头注意力机制注意力机制【5】Scaled Dot-Product Attention 和 mask attention 注意力机制【6】-tra ......

transformers更新时间 2023-12-30

Pandas - apply、agg、transform 函数

apply：行或列的操作。 agg：聚合，可以传递字典，对多个列使用不同的函数。最终结果可能会合并，与原 DataFrame 列长度不保持一致。 transform：转换，也可以对多个列使用不同的函数。但是最终结果与原 DataFrame 列长度保持一致，不会聚合。 ......

函数 transform Pandas apply agg更新时间 2023-12-30

Swin Transformer

Swin Transformer 目录Swin Transformer简介VIT的缺陷核心创新总体结构和运作网络细节Patch partitionLinear EmbeddingPatch MergingSwin Block模块W-MSASW-MSAAttention Mask计算成本分析主要优势S ......

Transformer Swin更新时间 2023-12-29

VIT Vision Transformer

VIT Vision Transformer 目录VIT Vision TransformerViT模型结构图像划分PatchLinear Projection of Flatted PatchesPatch+Position Embedding分类向量和位置向量EncoderMLP Head（全连 ......

Transformer Vision VIT更新时间 2023-12-29

DETR基于Transformer目标检测

DETR基于Transformer目标检测目录DETR基于Transformer目标检测DETR网络结构和NLP Transformer对比Object QueryFFN为什么DETR不需要NMS优缺点参考资料 DETR首次将Transformer应用到了目标检测任务中。图像会先经过一个传统的CN ......

Transformer 目标 DETR更新时间 2023-12-29

【Transformer 基础系列】手推显存占用

https://zhuanlan.zhihu.com/p/648924115 本文试图以最清晰的方式手动推导 Transformers 每一步的参数量到显存、计算量问题。理解底层，才能更好的做训练和优化。可能是目前最全的大模型显存优化方案分析。本文内容包括（1）模型训练和推理过程中的显存占用（2） ......

显存 Transformer 基础更新时间 2023-12-26

Unity3D 通过transform实现人物移动还是velocity详解

Unity3D是一款非常流行的游戏引擎，它提供了多种方式来实现游戏中的人物移动。其中，最常用的两种方法是通过transform组件和通过velocity属性来实现。对啦！这里有个游戏开发交流小组里面聚集了一帮热爱学习游戏的零基础小白，也有一些正在从事游戏开发的技术大佬，欢迎你来交流学习。通过tr ......

transform velocity Unity3D 人物还是更新时间 2023-12-26

共605篇 :1/21页 首页上一页1234下一页尾页