deephub

deephub

TinyTimeMixers(TTM)輕量級時間序列基礎模型：無需注意力機制，並且在零樣本預測方面表現出色

大語言模型的發展讓研究人員專注于建立盡可能大的模型。但是其實較小的模型在某些任務中表現會優于較大的模型時，例如：Llam

2024-06-11 10:59
如何應對缺失值帶來的分布變化？探索填充缺失值的最佳插補算法

本文將探討了缺失值插補的不同方法，並比較了它們在複原數據真實分布方面的效果，處理插補是一個不確定性的問題，尤其是在樣本量

2024-06-10 12:08
數據並非都是正態分布：三種常見的統計分布及其應用

你有沒有過這樣的經曆？使用一款減肥app，通過它的圖表來監控自己的體重變化，並預測何時能達到理想體重。這款app預測我需

2024-06-09 10:29
BlockTransformer：通過全局到局部的語言建模加速LLM推理

在基于transformer的自回歸語言模型（LMs）中，生成令牌的成本很高，這是因爲自注意力機制需要關注所有之前的令牌

2024-06-08 10:01
CNN依舊能戰：nnU-Net團隊新研究揭示醫學圖像分割的驗證誤區，設定先進的驗證標准與基線模型

這篇論文研究了在3D醫學圖像分割領近年引入了許多新的架構和方法，但大多數方法並沒有超過2018年的原始nnU-Net基准

2024-06-07 11:31
從提示工程到代理工程：構建高效AI代理的策略框架概述

自ChatGPT推出以來，僅僅一年多的時間裏，公衆對于“人工智能”（AI）的認識已經發生了根本性的變化。這種變化部分源于

2024-06-06 11:33
一切模型皆可聯邦化：高斯樸素貝葉斯代碼示例

聯邦學習是一種分布式的機器學習方法，其中多個客戶端在一個中央服務器的協調下合作訓練模型，但不共享他們的本地數據。一般情況

2024-06-05 10:57
爲什麽你的RAG不起作用？失敗的主要原因和解決方案

無數企業正在嘗試使用檢索增強生成（RAG），但在制作這些系統達到生産質量時普遍會感到失望。因爲他們的RAG不僅運行效果差

2024-06-04 11:43
2024年5月第四周LLM重要論文總結

本文總結了2024年5月第四周發表的一些最重要的LLM論文。這些論文的主題包括模型優化和縮放到推理、基准測試和增強性能。

2024-06-03 10:51
通過f-string編寫簡潔高效的Python格式化輸出代碼

Python 3.6中引入的f-string是Python中最常用的特征之一，它可以讓我們編寫更幹淨、更高效和更易于維護

2024-06-02 09:40
YOLOv10的改進、部署和微調訓練總結

YOLO模型因其在計算成本和檢測性能之間的平衡而在實時目標檢測中很受歡迎。前幾天YOLOv10也剛剛發布了。我們這篇文章

2024-06-01 11:15
長序列中Transformers的高級注意力機制總結

在處理長序列時，Transformers面臨著注意力分散和噪音增加等挑戰。隨著序列長度的增長，每個詞元必須與更多詞元競爭

2024-05-31 10:21
通過強化學習策略進行特征選擇

特征選擇是構建機器學習模型過程中的決定性步驟。爲模型和我們想要完成的任務選擇好的特征，可以提高性能。如果我們處理的是高維

2024-05-30 11:00
微調真的能讓LLM學到新東西嗎:引入新的知識可能讓模型産生更多的幻覺

大型語言模型(llm)是在巨大的文本語料庫上訓練的，在那裏他們獲得了大量的事實知識。這些知識嵌入到它們的參數中，然後可以

2024-05-29 10:46
SUPRA：無須額外訓練，將Transformer變爲高效RNN，推理速度倍增

Transformers 已經確立了自己作爲首要模型架構的地位，特別是因爲它們在各種任務中的出色表現。但是Transfo

2024-05-27 11:30
2024年5月大語言模型論文推薦：模型優化、縮放到推理、基准測試和增強性能

前一篇文章總結了關于計算機視覺方面的論文，這篇文章將要總結了2024年5月發表的一些最重要的大語言模型的論文。這些論文涵

2024-05-26 10:27
2024年5月計算機視覺論文推薦

我們今天總結下2024年5月發表的最重要的論文，重點介紹了計算機視覺領域的最新研究和進展，包括擴散模型、視覺語言模型、圖

2024-05-25 10:05
使用FP8加速PyTorch訓練的兩種方法總結

在PyTorch中，FP8（8-bit 浮點數）是一個較新的數據類型，用于實現高效的神經網絡訓練和推理。它主要被設計來降

2024-05-24 10:46
MambaOut：狀態空間模型並不適合圖像的分類任務

該論文探討了Mamba架構（包含狀態空間模型SSM）是否有必要用于視覺任務，如圖像分類、目標檢測和語義分割。通過實驗證實

2024-05-23 09:56
整合LlamaIndex與LangChain構建高級的查詢處理系統

構建大型語言模型應用程序可能會頗具挑戰，尤其是當我們在不同的框架（如Langchain和LlamaIndex）之間進行選

2024-05-22 10:08

提供專業的人工智能知識，包括CV NLP 數據挖掘等