youngkingdom/vllm - vllm - Gitea: Git with a cup of tea

Author	SHA1	Message	Date
Didier Durand	83609ca91d	[Doc]: fix typos in Python comments (#24173 ) Signed-off-by: Didier Durand <durand.didier@gmail.com> Co-authored-by: Russell Bryant <rbryant@redhat.com> Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>	2025-09-04 08:52:17 -07:00
mgazz	51d5e9be7d	[Core][Model] Terratorch backend integration (#23513 ) Signed-off-by: Michele Gazzetti <michele.gazzetti1@ibm.com> Signed-off-by: Christian Pinto <christian.pinto@ibm.com> Co-authored-by: Christian Pinto <christian.pinto@ibm.com> Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>	2025-09-04 00:22:41 -07:00
bingchen-mi	e7fc70016f	[Model] Add MiDashengLM model support (#23652 ) Signed-off-by: chenbing8 <chenbing8@xiaomi.com> Signed-off-by: bingchen-mi <chenbing8@xiaomi.com> Co-authored-by: Jee Jee Li <pandaleefree@gmail.com> Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-09-04 00:08:09 -07:00
Peter Pan	b5ee1e3261	Remove deprecated `PyNcclConnector` (#24151 ) Signed-off-by: Peter Pan <Peter.Pan@daocloud.io>	2025-09-03 22:49:16 +00:00
bnellnm	e9b92dcd89	[Kernels] Overlap shared experts with send/recv (#23273 ) Signed-off-by: Bill Nell <bnell@redhat.com>	2025-09-03 12:35:18 -04:00
co63oc	1bd007f234	fix some typos (#24071 ) Signed-off-by: co63oc <co63oc@users.noreply.github.com>	2025-09-02 20:44:50 -07:00
afeldman-nm	136d853e65	[V1] Wrapper which plumbs request-level logits processors into vLLM batch-level logits processing (#23656 ) Signed-off-by: Andrew Feldman <afeldman@redhat.com>	2025-09-03 02:52:51 +00:00
Mark McLoughlin	2417798471	[Metrics] Deprecate TPOT in favor of ITL (#24110 ) Signed-off-by: Mark McLoughlin <markmc@redhat.com>	2025-09-02 18:10:10 +00:00
Nicolò Lucchesi	0a74e9d0f2	[Gemma3n] Fix audio batching (#24052 ) Signed-off-by: NickLucche <nlucches@redhat.com>	2025-09-02 22:23:35 +08:00
Christian Berge	8bd5844989	correct LWS deployment yaml (#23104 ) Signed-off-by: cberge908 <42270330+cberge908@users.noreply.github.com>	2025-09-02 12:04:59 +00:00
Christian Pinto	cf91a89dd2	[docs][misc] IOProcessor plugins fixes (#24046 ) Signed-off-by: Christian Pinto <christian.pinto@ibm.com>	2025-09-01 09:17:41 -07:00
Kwai-Keye	7c8271cd1e	[Model]: support KeyeVL-1_5-8B (#23838 ) Signed-off-by: wangruitao <wangruitao@kuaishou.com> Co-authored-by: wangruitao <wangruitao@kuaishou.com>	2025-09-01 03:50:27 -07:00
Didier Durand	107284959a	[Doc]: fix typos in Python comments (#24026 ) Signed-off-by: Didier Durand <durand.didier@gmail.com>	2025-09-01 09:38:20 +00:00
Christian Pinto	1cb39dbcdd	[Misc] IO Processor plugins for pooling models (#22820 ) Signed-off-by: Christian Pinto <christian.pinto@ibm.com> Signed-off-by: Max de Bayser <mbayser@br.ibm.com> Co-authored-by: Max de Bayser <mbayser@br.ibm.com>	2025-08-31 23:07:12 -07:00
Or Ozeri	14b4326b94	v1: Support KV events from connectors (#19737 ) Signed-off-by: Or Ozeri <oro@il.ibm.com>	2025-09-01 01:13:21 +00:00
Woosuk Kwon	a3432f18fd	[BugFix][Spec Decode] Use float64 for uniform_probs (#23803 ) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>	2025-08-28 12:26:45 +00:00
Nick Hill	3ce8285d6d	[LogitsProcs] Deduplicate built-in LP implementation logic (#23362 ) Signed-off-by: Nick Hill <nhill@redhat.com>	2025-08-27 23:11:33 +08:00
CSWYF3634076	644d57d531	[Model] Add Ernie4.5 VL Model Support (#22514 ) Signed-off-by: wangyafeng <wangyafeng@baidu.com>	2025-08-26 21:02:55 -07:00
Yiheng Xu	786835807b	[Bugfix]: Qwen3 Coder Tool Parser (#23099 ) Signed-off-by: Yiheng Xu <charlesyihengxu@gmail.com> Co-authored-by: Aaron Pham <contact@aarnphm.xyz>	2025-08-26 19:58:32 -07:00
汪志鹏	416f05929a	[New Model]Donut model (#23229 ) Signed-off-by: 汪志鹏 <wangzhipeng628@gmail.com>	2025-08-24 12:52:24 +00:00
Xu Wenqing	b8f17f5d98	Support DeepSeek-V3.1 tool call (#23454 ) Signed-off-by: Xu Wenqing <xuwq1993@qq.com>	2025-08-23 05:50:16 +00:00
Philip Chung	de9c085e17	[Misc] Add gemma3 chat template with pythonic-style function calling (#17149 ) Signed-off-by: Philip Chung <philip.f.chung@gmail.com>	2025-08-21 21:06:50 -07:00
Cyrus Leung	8896eb72eb	[Deprecation] Remove `prompt_token_ids` arg fallback in `LLM.generate` and `LLM.embed` (#18800 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-22 10:56:57 +08:00
jerryzhuang	f8daddcc4c	[Bugfix] set system_message in phi4mini chat template (#23309 ) Signed-off-by: zhuangqh <zhuangqhc@gmail.com>	2025-08-21 14:22:39 +00:00
Cyrus Leung	0c31e28e95	[Bugfix] Fix extra whitespace in strings caused by newline (#23272 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-20 22:03:00 -07:00
杨奇(yann qi)	655a09f653	[Model][VLM] Support R-4B Model (#23246 ) Signed-off-by: yannqi <yannqi@qq.com> Signed-off-by: 杨奇(yann qi) <51905299+yannqi@users.noreply.github.com> Signed-off-by: Cyrus Leung <cyrus.tl.leung@gmail.com> Co-authored-by: yannqiyang <yannqiyang@tencent.com> Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>	2025-08-21 04:08:52 +00:00
myselvess	b87cb97a53	[Model] support new model ovis2.5 (#23084 ) Signed-off-by: myselvess <244285088@qq.com> Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn> Co-authored-by: Isotr0py <2037008807@qq.com> Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-08-19 13:12:59 +00:00
Isotr0py	31fd3265c8	[Bugfix] Fix broken Minimax-01-VL model (#22116 ) Signed-off-by: Isotr0py <2037008807@qq.com> Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-08-19 08:49:29 +00:00
qizixi	4efd43e9b4	Fix GLM-4.5V-FP8 numerical issue (#22949 ) Signed-off-by: qizixi <qizixi@meta.com> Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>	2025-08-19 07:56:31 +00:00
afeldman-nm	bf7f470b22	[V1] Logits processors extensibility (#19912 ) Signed-off-by: Andrew Feldman <afeldman@redhat.com> Signed-off-by: Andrew Feldman <afeld2012@gmail.com> Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> Signed-off-by: Nick Hill <nhill@redhat.com> Co-authored-by: Nick Hill <nhill@redhat.com> Co-authored-by: Andrew Feldman <afeld2012@gmail.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-08-16 12:59:17 -07:00
Michael Goin	4fc722eca4	[Kernel/Quant] Remove AQLM (#22943 ) Signed-off-by: mgoin <mgoin64@gmail.com> Co-authored-by: Wentao Ye <44945378+yewentao256@users.noreply.github.com>	2025-08-16 19:38:21 +00:00
汪志鹏	829bbd7882	[New Model]mBART model (#22883 ) Signed-off-by: 汪志鹏 <wangzhipeng628@gmail.com>	2025-08-16 12:16:58 +00:00
bnellnm	8ad7285ea2	[Kernels] Clean up FusedMoeMethodBase and modular kernel setup. Remove extra arguments from modular kernel methods. (#22035 ) Signed-off-by: Bill Nell <bnell@redhat.com> Co-authored-by: Michael Goin <mgoin64@gmail.com>	2025-08-15 14:46:00 -04:00
Shanshan Shen	48b01fd4d4	[Structured Output] Make the output of structured output example more complete (#22481 ) Signed-off-by: shen-shanshan <467638484@qq.com>	2025-08-15 18:29:25 +00:00
Kdump	653124bd46	[Frontend] Add chunked processing to handle long inputs in embedding models (#22280 ) Signed-off-by: x22x22 <wadeking@qq.com> Signed-off-by: Kdump <rootshellexp@gmail.com> Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com> Co-authored-by: Maximilien de Bayser <maxdebayser@gmail.com> Co-authored-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-13 04:14:24 -07:00
zejunchen-zejun	50f2aae1b4	[LMCache][Example] Align the PYTHONHASHSEED for prefillers and decoders for KV chunks hashing (#21161 ) Signed-off-by: zejunchen-zejun <zejun.chen@amd.com>	2025-08-12 02:05:14 -07:00
dongluw	9f909b8996	[New Model] Support Command-A-Vision (#22660 ) Signed-off-by: donglu <donglu@cohere.com>	2025-08-12 01:39:54 -07:00
Nicolò Lucchesi	5a16fa614c	[Model] Gemma3n MM (#20495 ) Signed-off-by: ShriKode <shrikode@gmail.com> Signed-off-by: NickLucche <nlucches@redhat.com> Signed-off-by: Roger Wang <hey@rogerw.me> Co-authored-by: ShriKode <shrikode@gmail.com> Co-authored-by: Roger Wang <hey@rogerw.me>	2025-08-09 09:56:25 -07:00
Cyrus Leung	139d155781	[Frontend] Use engine argument to control MM cache size (#22441 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-07 09:47:10 -07:00
Cyrus Leung	766bc8162c	[Core] Store only the keys for multi-modal data in P0 (#22198 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-07 01:45:04 -07:00
Zhang Jason	b4b9813b5e	add the codes to check AMD Instinct GPU number (#22367 ) Signed-off-by: Zhang Jason <ning.zhang2@amd.com>	2025-08-06 08:58:38 -07:00
Zhonghua Deng	c09efff976	[Bugfix][V1][P/D]Fix the uneven polling issue in the toy proxy for P2pNcclConnector (#21819 ) Signed-off-by: Abatom <abzhonghua@gmail.com>	2025-08-04 20:17:05 +00:00
Jee Jee Li	a7b8788d2c	[Misc] Modify the organization of GLM series (#22171 ) Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>	2025-08-03 23:51:20 -07:00
22quinn	845420ac2c	[RLHF] Fix torch.dtype not serializable in example (#22158 ) Signed-off-by: 22quinn <33176974+22quinn@users.noreply.github.com>	2025-08-04 02:43:33 +00:00
Roger Wang	067c34a155	docs: remove deprecated disable-log-requests flag (#22113 ) Signed-off-by: Roger Wang <hey@rogerw.me>	2025-08-02 00:19:48 -07:00
Abirdcfly	5c54d9759d	[Bugfix][PD] set max_completion_tokens=1 if req has this value (#21841 ) Signed-off-by: Abirdcfly <fp544037857@gmail.com>	2025-08-01 06:08:45 -07:00
Roger Wang	27a145e893	[Doc] Add example for Step3-VL (#22061 ) Signed-off-by: Roger Wang <hey@rogerw.me>	2025-08-01 08:35:49 +00:00
Cyrus Leung	82de9b9d46	[Misc] Automatically resolve HF processor init kwargs (#22005 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-07-31 22:44:10 -07:00
zhiweiz	9e0726e5bf	[Meta] Official Eagle mm support, first enablement on llama4 (#20788 ) Signed-off-by: morgendave <morgendave@gmail.com> Co-authored-by: Roger Wang <hey@rogerw.me>	2025-07-31 10:35:07 -07:00
Michael Goin	9cb497bfa3	[Example] Add `async_llm_streaming.py` example for AsyncLLM streaming in python (#21763 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-07-30 18:39:46 -06:00

1 2 3 4 5 ...

578 Commits