youngkingdom/vllm - vllm - Gitea: Git with a cup of tea

Author	SHA1	Message	Date
bnellnm	8ad7285ea2	[Kernels] Clean up FusedMoeMethodBase and modular kernel setup. Remove extra arguments from modular kernel methods. (#22035 ) Signed-off-by: Bill Nell <bnell@redhat.com> Co-authored-by: Michael Goin <mgoin64@gmail.com>	2025-08-15 14:46:00 -04:00
Shanshan Shen	48b01fd4d4	[Structured Output] Make the output of structured output example more complete (#22481 ) Signed-off-by: shen-shanshan <467638484@qq.com>	2025-08-15 18:29:25 +00:00
Kdump	653124bd46	[Frontend] Add chunked processing to handle long inputs in embedding models (#22280 ) Signed-off-by: x22x22 <wadeking@qq.com> Signed-off-by: Kdump <rootshellexp@gmail.com> Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com> Co-authored-by: Maximilien de Bayser <maxdebayser@gmail.com> Co-authored-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-13 04:14:24 -07:00
zejunchen-zejun	50f2aae1b4	[LMCache][Example] Align the PYTHONHASHSEED for prefillers and decoders for KV chunks hashing (#21161 ) Signed-off-by: zejunchen-zejun <zejun.chen@amd.com>	2025-08-12 02:05:14 -07:00
dongluw	9f909b8996	[New Model] Support Command-A-Vision (#22660 ) Signed-off-by: donglu <donglu@cohere.com>	2025-08-12 01:39:54 -07:00
Nicolò Lucchesi	5a16fa614c	[Model] Gemma3n MM (#20495 ) Signed-off-by: ShriKode <shrikode@gmail.com> Signed-off-by: NickLucche <nlucches@redhat.com> Signed-off-by: Roger Wang <hey@rogerw.me> Co-authored-by: ShriKode <shrikode@gmail.com> Co-authored-by: Roger Wang <hey@rogerw.me>	2025-08-09 09:56:25 -07:00
Cyrus Leung	139d155781	[Frontend] Use engine argument to control MM cache size (#22441 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-07 09:47:10 -07:00
Cyrus Leung	766bc8162c	[Core] Store only the keys for multi-modal data in P0 (#22198 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-08-07 01:45:04 -07:00
Zhang Jason	b4b9813b5e	add the codes to check AMD Instinct GPU number (#22367 ) Signed-off-by: Zhang Jason <ning.zhang2@amd.com>	2025-08-06 08:58:38 -07:00
Zhonghua Deng	c09efff976	[Bugfix][V1][P/D]Fix the uneven polling issue in the toy proxy for P2pNcclConnector (#21819 ) Signed-off-by: Abatom <abzhonghua@gmail.com>	2025-08-04 20:17:05 +00:00
Jee Jee Li	a7b8788d2c	[Misc] Modify the organization of GLM series (#22171 ) Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>	2025-08-03 23:51:20 -07:00
22quinn	845420ac2c	[RLHF] Fix torch.dtype not serializable in example (#22158 ) Signed-off-by: 22quinn <33176974+22quinn@users.noreply.github.com>	2025-08-04 02:43:33 +00:00
Roger Wang	067c34a155	docs: remove deprecated disable-log-requests flag (#22113 ) Signed-off-by: Roger Wang <hey@rogerw.me>	2025-08-02 00:19:48 -07:00
Abirdcfly	5c54d9759d	[Bugfix][PD] set max_completion_tokens=1 if req has this value (#21841 ) Signed-off-by: Abirdcfly <fp544037857@gmail.com>	2025-08-01 06:08:45 -07:00
Roger Wang	27a145e893	[Doc] Add example for Step3-VL (#22061 ) Signed-off-by: Roger Wang <hey@rogerw.me>	2025-08-01 08:35:49 +00:00
Cyrus Leung	82de9b9d46	[Misc] Automatically resolve HF processor init kwargs (#22005 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2025-07-31 22:44:10 -07:00
zhiweiz	9e0726e5bf	[Meta] Official Eagle mm support, first enablement on llama4 (#20788 ) Signed-off-by: morgendave <morgendave@gmail.com> Co-authored-by: Roger Wang <hey@rogerw.me>	2025-07-31 10:35:07 -07:00
Michael Goin	9cb497bfa3	[Example] Add `async_llm_streaming.py` example for AsyncLLM streaming in python (#21763 ) Signed-off-by: mgoin <mgoin64@gmail.com>	2025-07-30 18:39:46 -06:00
Hongsheng Liu	5c8fe389d6	[Docs] Fix the example code of streaming chat completions in reasoning (#21825 ) Signed-off-by: wangzi <3220100013@zju.edu.cn> Co-authored-by: wangzi <3220100013@zju.edu.cn> Co-authored-by: Zi Wang <66560864+BruceW-07@users.noreply.github.com>	2025-07-30 12:11:58 +00:00
wang.yuqi	65f311ce59	[Frontend] Add LLM.reward specific to reward models (#21720 ) Signed-off-by: wang.yuqi <noooop@126.com>	2025-07-29 20:56:03 -07:00
Harry Mellor	ba5c5e5404	[Docs] Switch to better markdown linting pre-commit hook (#21851 ) Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-07-29 19:45:08 -07:00
Chauncey	63fe3a700f	[PD] let p2p nccl toy proxy handle /chat/completions (#21734 ) Signed-off-by: chaunceyjiang <chaunceyjiang@gmail.com>	2025-07-28 11:45:50 +00:00
Ning Xie	150d9e6337	[Bugfix] fix max-file-size type from str to int (#21675 ) Signed-off-by: Andy Xie <andy.xning@gmail.com>	2025-07-28 00:06:52 -07:00
Cyrus Leung	86ae693f20	[Deprecation][2/N] Replace `--task` with `--runner` and `--convert` (#21470 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-07-27 19:42:40 -07:00
Isotr0py	3d847a3125	[VLM] Add video support for Intern-S1 (#21671 ) Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-07-27 11:49:43 +00:00
Ning Xie	1cbf951ba2	[Misc] add default value for file pattern arg (#21659 ) Signed-off-by: Andy Xie <andy.xning@gmail.com>	2025-07-27 05:14:51 +00:00
Ye (Charlotte) Qi	01a395e9e7	[CI/Build][Doc] Clean up more docs that point to old bench scripts (#21667 ) Signed-off-by: Ye (Charlotte) Qi <yeq@meta.com>	2025-07-27 04:02:12 +00:00
Isotr0py	eed2f463b2	[VLM] Support HF format Phi-4-MM model (#17121 ) Signed-off-by: Isotr0py <2037008807@qq.com>	2025-07-26 20:07:57 -07:00
Ye (Charlotte) Qi	e7c4f9ee86	[CI/Build][Doc] Move existing benchmark scripts in CI/document/example to vllm bench CLI (#21355 ) Signed-off-by: Ye (Charlotte) Qi <yeq@meta.com>	2025-07-26 07:10:14 -07:00
Maximilien de Bayser	1cd6eaba54	Support encoder-only models without KV-Cache (#21270 ) Signed-off-by: Max de Bayser <maxdebayser@gmail.com> Signed-off-by: Max de Bayser <mbayser@br.ibm.com> Co-authored-by: Russell Bryant <rbryant@redhat.com>	2025-07-26 21:09:52 +08:00
Lyu Han	875af38e01	Support Intern-S1 (#21628 ) Signed-off-by: Roger Wang <hey@rogerw.me> Signed-off-by: Isotr0py <2037008807@qq.com> Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn> Co-authored-by: Your Name <you@example.com> Co-authored-by: Roger Wang <hey@rogerw.me> Co-authored-by: Isotr0py <2037008807@qq.com> Co-authored-by: Isotr0py <mozf@mail2.sysu.edu.cn>	2025-07-26 19:14:04 +08:00
bigshanedogg	29c6fbe58c	[MODEL] New model support for naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B (#20931 ) Signed-off-by: bigshanedogg <bigshane319@gmail.com>	2025-07-25 06:05:42 -07:00
Sanger Steel	cdb79ee63d	[Docs] Update Tensorizer usage documentation (#21190 ) Signed-off-by: Sanger Steel <sangersteel@gmail.com> Signed-off-by: William Goldby <willgoldby@gmail.com> Co-authored-by: William Goldby <willgoldby@gmail.com>	2025-07-24 06:56:18 -07:00
WeiQing Chen	f8c15c4efb	[Bugfix] Fix example disagg_example_p2p_nccl_xpyd.sh zombie process (#21437 ) Signed-off-by: David Chen <530634352@qq.com>	2025-07-23 20:42:11 -07:00
Christian Pinto	8560a5b258	[Core][Model] PrithviMAE Enablement on vLLM v1 engine (#20577 ) Signed-off-by: Christian Pinto <christian.pinto@ibm.com>	2025-07-23 11:00:23 -07:00
Kebe	bc8a8ce5ec	[Misc] Remove deprecated args in v0.10 (#21349 ) Signed-off-by: Kebe <mail@kebe7jun.com>	2025-07-22 05:26:39 -07:00
Ning Xie	d97841078b	[Misc] unify variable for LLM instance (#20996 ) Signed-off-by: Andy Xie <andy.xning@gmail.com>	2025-07-21 12:18:33 +01:00
Jiayi Yan	7ba34b1241	[bugfix] fix syntax warning caused by backslash (#21251 )	2025-07-20 17:12:10 +00:00
Rui Qiao	217937221b	Elastic Expert Parallel Initial Support (#20775 ) Signed-off-by: Rui Qiao <ruisearch42@gmail.com>	2025-07-18 17:46:09 -07:00
22quinn	b38baabcf9	[Doc] Add inplace weights loading example (#19640 ) Signed-off-by: 22quinn <33176974+22quinn@users.noreply.github.com>	2025-07-17 21:12:23 -07:00
kYLe	4ef00b5cac	[VLM] Add Nemotron-Nano-VL-8B-V1 support (#20349 ) Signed-off-by: Kyle Huang <kylhuang@nvidia.com> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>	2025-07-17 03:07:55 -07:00
Asher	5a7fb3ab9e	[Model] Add ToolParser and MoE Config for Hunyuan A13B (#20820 ) Signed-off-by: Asher Zhang <asherszhang@tencent.com>	2025-07-17 09:10:09 +00:00
Zhonghua Deng	8a4e5c5f3c	[V1][P/D]Enhance Performance and code readability for P2pNcclConnector (#20906 ) Signed-off-by: Abatom <abzhonghua@gmail.com>	2025-07-16 22:13:00 -07:00
zhiweiz	c11013db8b	[Meta] Llama4 EAGLE Support (#20591 ) Signed-off-by: qizixi <qizixi@meta.com> Co-authored-by: qizixi <qizixi@meta.com>	2025-07-15 21:14:15 -07:00
Patrick von Platen	e7e3e6d263	Voxtral (#20970 ) Signed-off-by: Patrick von Platen <patrick.v.platen@gmail.com> Co-authored-by: Cyrus Leung <cyrus.tl.leung@gmail.com>	2025-07-15 07:35:30 -07:00
Ricardo Decal	33d560001e	[Docs] Improve documentation for ray cluster launcher helper script (#20602 ) Signed-off-by: Ricardo Decal <rdecal@anyscale.com>	2025-07-15 03:55:45 -07:00
Ricardo Decal	235bfd5dfe	[Docs] Improve documentation for RLHF example (#20598 ) Signed-off-by: Ricardo Decal <rdecal@anyscale.com>	2025-07-15 01:54:10 -07:00
sfbemerk	251595368f	Fix DeepSeek-R1-0528 chat template (#20717 ) Signed-off-by: Benjamin Merkel <benjamin.merkel@tngtech.com> Co-authored-by: Benjamin Merkel <benjamin.merkel@tngtech.com>	2025-07-10 17:47:36 +00:00
shineran96	4bed167768	[Model][VLM] Support JinaVL Reranker (#20260 ) Signed-off-by: shineran96 <shinewang96@gmail.com>	2025-07-10 10:43:43 -07:00
Ricardo Decal	853487bc1b	[Docs] Improve docs for RLHF co-location example (#20599 ) Signed-off-by: Ricardo Decal <rdecal@anyscale.com> Co-authored-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>	2025-07-09 08:06:43 -07:00

1 2 3 4 5 ...

546 Commits