youngkingdom/vllm - vllm - Gitea: Git with a cup of tea

Author	SHA1	Message	Date
Russell Bryant	098f94de42	[CI/Build] Drop Python 3.8 support (#10038 ) Signed-off-by: Russell Bryant <rbryant@redhat.com> Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk> Co-authored-by: DarkLight1337 <tlleungac@connect.ust.hk>	2024-11-06 14:31:01 +00:00
Michael Goin	399c798608	Remove ScaledActivation for AWQ (#10057 ) Signed-off-by: mgoin <michael@neuralmagic.com>	2024-11-06 14:27:06 +00:00
Eric	406d4cc480	[Model][LoRA]LoRA support added for Qwen2VLForConditionalGeneration (#10022 ) Signed-off-by: ericperfect <ericperfectttt@gmail.com>	2024-11-06 14:13:15 +00:00
Jee Jee Li	a5bba7d234	[Model] Add Idefics3 support (#9767 ) Signed-off-by: Jee Jee Li <pandaleefree@gmail.com> Signed-off-by: B-201 <Joy25810@foxmail.com> Co-authored-by: B-201 <Joy25810@foxmail.com>	2024-11-06 11:41:17 +00:00
Jee Jee Li	2003cc3513	[Model][LoRA]LoRA support added for LlamaEmbeddingModel (#10071 ) Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>	2024-11-06 09:49:19 +00:00
Woosuk Kwon	6a585a23d2	[Hotfix] Fix ruff errors (#10073 ) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>	2024-11-06 01:24:28 -08:00
Konrad Zawora	a02a50e6e5	[Hardware][Intel-Gaudi] Add Intel Gaudi (HPU) inference backend (#6143 ) Signed-off-by: yuwenzho <yuwen.zhou@intel.com> Signed-off-by: Chendi.Xue <chendi.xue@intel.com> Signed-off-by: Bob Zhu <bob.zhu@intel.com> Signed-off-by: zehao-intel <zehao.huang@intel.com> Signed-off-by: Konrad Zawora <kzawora@habana.ai> Co-authored-by: Kunshang Ji <kunshang.ji@intel.com> Co-authored-by: Sanju C Sudhakaran <scsudhakaran@habana.ai> Co-authored-by: Michal Adamczyk <madamczyk@habana.ai> Co-authored-by: Marceli Fylcek <mfylcek@habana.ai> Co-authored-by: Himangshu Lahkar <49579433+hlahkar@users.noreply.github.com> Co-authored-by: Vivek Goel <vgoel@habana.ai> Co-authored-by: yuwenzho <yuwen.zhou@intel.com> Co-authored-by: Dominika Olszewska <dolszewska@habana.ai> Co-authored-by: barak goldberg <149692267+bgoldberg-habana@users.noreply.github.com> Co-authored-by: Michal Szutenberg <37601244+szutenberg@users.noreply.github.com> Co-authored-by: Jan Kaniecki <jkaniecki@habana.ai> Co-authored-by: Agata Dobrzyniewicz <160237065+adobrzyniewicz-habana@users.noreply.github.com> Co-authored-by: Krzysztof Wisniewski <kwisniewski@habana.ai> Co-authored-by: Dudi Lester <160421192+dudilester@users.noreply.github.com> Co-authored-by: Ilia Taraban <tarabanil@gmail.com> Co-authored-by: Chendi.Xue <chendi.xue@intel.com> Co-authored-by: Michał Kuligowski <mkuligowski@habana.ai> Co-authored-by: Jakub Maksymczuk <jmaksymczuk@habana.ai> Co-authored-by: Tomasz Zielinski <85164140+tzielinski-habana@users.noreply.github.com> Co-authored-by: Sun Choi <schoi@habana.ai> Co-authored-by: Iryna Boiko <iboiko@habana.ai> Co-authored-by: Bob Zhu <41610754+czhu15@users.noreply.github.com> Co-authored-by: hlin99 <73271530+hlin99@users.noreply.github.com> Co-authored-by: Zehao Huang <zehao.huang@intel.com> Co-authored-by: Andrzej Kotłowski <Andrzej.Kotlowski@intel.com> Co-authored-by: Yan Tomsinsky <73292515+Yantom1@users.noreply.github.com> Co-authored-by: Nir David <ndavid@habana.ai> Co-authored-by: Yu-Zhou <yu.zhou@intel.com> Co-authored-by: Ruheena Suhani Shaik <rsshaik@habana.ai> Co-authored-by: Karol Damaszke <kdamaszke@habana.ai> Co-authored-by: Marcin Swiniarski <mswiniarski@habana.ai> Co-authored-by: Woosuk Kwon <woosuk.kwon@berkeley.edu> Co-authored-by: Jacek Czaja <jacek.czaja@intel.com> Co-authored-by: Jacek Czaja <jczaja@habana.ai> Co-authored-by: Yuan <yuan.zhou@outlook.com>	2024-11-06 01:09:10 -08:00
Isotr0py	a5fda50a10	[CI/Build] Fix large_gpu_mark reason (#10070 ) Signed-off-by: Isotr0py <2037008807@qq.com>	2024-11-06 08:50:37 +00:00
Aaron Pham	21063c11c7	[CI/Build] drop support for Python 3.8 EOL (#8464 ) Signed-off-by: Aaron Pham <contact@aarnphm.xyz>	2024-11-06 07:11:55 +00:00
youkaichao	4be3a45158	[distributed] add function to create ipc buffers directly (#10064 ) Signed-off-by: youkaichao <youkaichao@gmail.com>	2024-11-05 22:35:03 -08:00
Woosuk Kwon	4089985552	[V1] Integrate Piecewise CUDA graphs (#10058 ) Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>	2024-11-05 22:16:04 -08:00
zifeitong	9d59b75593	[Bugfix] Remove CustomChatCompletionContentPartParam multimodal input type (#10054 ) Signed-off-by: Zifei Tong <zifeitong@gmail.com>	2024-11-06 05:13:09 +00:00
arakowsk-amd	ea928f608c	[Bugfix] Gpt-j-6B patch kv_scale to k_scale path (#10063 ) Signed-off-by: Alex Rakowski <alex.rakowski@amd.com> Signed-off-by: Alex Rakowski <182798202+arakowsk-amd@users.noreply.github.com>	2024-11-06 05:10:40 +00:00
Travis Johnson	2bcbae704c	[Bugfix] Fix edge-case crash when using chat with the Mistral Tekken Tokenizer (#10051 ) Signed-off-by: Travis Johnson <tsjohnso@us.ibm.com>	2024-11-06 04:28:29 +00:00
Peter Salas	ffc0f2b47a	[Model][OpenVINO] Fix regressions from #8346 (#10045 ) Signed-off-by: Peter Salas <peter@fixie.ai>	2024-11-06 04:19:15 +00:00
Cyrus Leung	82bfc38d07	[Misc] Sort the list of embedding models (#10037 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2024-11-06 04:05:05 +00:00
youkaichao	c4cacbaa7f	[v1] reduce graph capture time for piecewise cudagraph (#10059 ) Signed-off-by: youkaichao <youkaichao@gmail.com>	2024-11-05 18:19:50 -08:00
Sungjae Lee	0c63c34f72	[Bugfix][SpecDecode] kv corruption with bonus tokens in spec decode (#9730 ) Co-authored-by: LiuXiaoxuanPKU <lilyliupku@gmail.com>	2024-11-06 01:45:45 +00:00
Wallas Henrique	966e31697b	[Bugfix] Fix pickle of input when async output processing is on (#9931 ) Signed-off-by: Wallas Santos <wallashss@ibm.com>	2024-11-06 00:39:26 +00:00
zifeitong	43300bd98a	[Bugfix] Properly propagate trust_remote_code settings (#10047 ) Signed-off-by: Zifei Tong <zifeitong@gmail.com>	2024-11-05 16:34:40 -08:00
youkaichao	ca9844b340	[bugfix] fix weak ref in piecewise cudagraph and tractable test (#10048 ) Signed-off-by: youkaichao <youkaichao@gmail.com>	2024-11-05 14:49:20 -08:00
Michael Goin	235366fe2e	[CI] Prune back the number of tests in tests/kernels/* (#9932 ) Signed-off-by: mgoin <michael@neuralmagic.com>	2024-11-05 16:02:32 -05:00
Michael Goin	02462465ea	[CI] Prune tests/models/decoder_only/language/* tests (#9940 ) Signed-off-by: mgoin <michael@neuralmagic.com>	2024-11-05 16:02:23 -05:00
Jee Jee Li	b9c64c0ca7	[Misc] Modify BNB parameter name (#9997 ) Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>	2024-11-05 14:40:08 -05:00
lkchen	d2e80332a7	[Feature] Update benchmark_throughput.py to support image input (#9851 ) Signed-off-by: Linkun Chen <github+anyscale@lkchen.net> Co-authored-by: Linkun Chen <github+anyscale@lkchen.net>	2024-11-05 19:30:02 +00:00
Michael Goin	a53046b16f	[Model] Support quantization of PixtralHFTransformer for PixtralHF (#9921 ) Signed-off-by: mgoin <michael@neuralmagic.com>	2024-11-05 10:42:20 -08:00
Russell Bryant	731aec5be7	[CI/Build] Limit github CI jobs based on files changed (#9928 ) Signed-off-by: Russell Bryant <rbryant@redhat.com>	2024-11-05 10:30:42 -08:00
Chenghao (Alan) Yang	09d3550372	[Misc] Add logging for CUDA memory (#10027 ) Signed-off-by: Chenghao Yang <yangalan1996@gmail.com> Signed-off-by: youkaichao <youkaichao@gmail.com> Co-authored-by: Chenghao Yang <yangalan1996@gmail.com> Co-authored-by: youkaichao <youkaichao@gmail.com>	2024-11-05 09:50:50 -08:00
Richard Liu	cd34029e91	Refactor TPU requirements file and pin build dependencies (#10010 ) Signed-off-by: Richard Liu <ricliu@google.com>	2024-11-05 16:48:44 +00:00
Russell Bryant	5952d81139	[Frontend] Fix tcp port reservation for api server (#10012 ) Signed-off-by: Russell Bryant <rbryant@redhat.com>	2024-11-05 07:50:57 -08:00
Chauncey	93dee88f6b	[Misc] vllm CLI flags should be ordered for better user readability (#10017 ) Signed-off-by: chaunceyjiang <chaunceyjiang@gmail.com>	2024-11-05 18:59:56 +08:00
Gene Der Su	7a83b1aec0	[BugFix] Lazy import ray (#10021 )	2024-11-05 10:04:10 +00:00
Tyler Michael Smith	ad23318928	[Bugfix] Fixup Mamba (#10004 ) Signed-off-by: Tyler Michael Smith <tyler@neuralmagic.com>	2024-11-05 03:46:38 +00:00
Cyrus Leung	bbc3619dc8	[Core] Make encoder-decoder inputs a nested structure to be more composable (#9604 ) Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>	2024-11-05 10:07:31 +08:00
Tyler Michael Smith	04bbf38e05	[Core] Use os.sched_yield in ShmRingBuffer instead of time.sleep (#9994 ) Signed-off-by: Tyler Michael Smith <tyler@neuralmagic.com>	2024-11-05 01:08:21 +00:00
Michael Goin	8f0a9ca890	[Bugfix] Respect modules_to_not_convert within awq_marlin (#9895 ) Signed-off-by: mgoin <michael@neuralmagic.com>	2024-11-04 16:57:44 -07:00
youkaichao	2094062b4e	[4.5/N] bugfix for quant config in speculative decode (#10007 ) Signed-off-by: youkaichao <youkaichao@gmail.com>	2024-11-04 15:11:59 -08:00
bnellnm	d93478b399	[Bugfix] Upgrade to pytorch 2.5.1 (#10001 ) Signed-off-by: Bill Nell <bill@neuralmagic.com>	2024-11-04 15:11:28 -08:00
tomeras91	ac04a97a9f	[Frontend] Add max_tokens prometheus metric (#9881 ) Signed-off-by: Tomer Asida <tomera@ai21.com>	2024-11-04 22:53:24 +00:00
lkchen	9a5664d4a4	[Misc] Refactor benchmark_throughput.py (#9779 ) Signed-off-by: Linkun Chen <github+anyscale@lkchen.net> Co-authored-by: Linkun Chen <lkchen@github.com> Co-authored-by: Linkun Chen <github+anyscale@lkchen.net>	2024-11-04 14:32:16 -08:00
Robert Shaw	04cef2c6ab	[Bugfix] Fix `MQLLMEngine` hanging (#9973 ) Signed-off-by: rshaw@neuralmagic.com <rshaw@neuralmagic.com>	2024-11-04 16:01:43 -05:00
Roger Wang	6e056bcf04	[Doc] Update VLM doc about loading from local files (#9999 ) Signed-off-by: Roger Wang <ywang@roblox.com>	2024-11-04 19:47:11 +00:00
hissu-hyvarinen	5208dc7a20	[Bugfix][CI/Build][Hardware][AMD] Shard ID parameters in AMD tests running parallel jobs (#9279 ) Signed-off-by: Hissu Hyvarinen <hissu.hyvarinen@amd.com>	2024-11-04 11:37:46 -08:00
Robert Shaw	1c45f4c385	[CI] Basic Integration Test For TPU (#9968 ) Signed-off-by: Robert Shaw <rshaw@neuralmagic.com>	2024-11-04 11:34:26 -08:00
Mor Zusman	603a661ae8	[Model] factoring out MambaMixer out of Jamba (#8993 ) Signed-off-by: mzusman <mor.zusmann@gmail.com>	2024-11-04 18:00:00 +00:00
Jee Jee Li	fb2716d641	[Misc]Reduce BNB static variable (#9987 ) Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>	2024-11-04 17:04:40 +00:00
youkaichao	8d72bb20fa	[4/N] make quant config first-class citizen (#9978 ) Signed-off-by: youkaichao <youkaichao@gmail.com>	2024-11-04 08:51:31 -08:00
Chauncey	ac6b8f19b9	[Frontend] Multi-Modality Support for Loading Local Image Files (#9915 ) Signed-off-by: chaunceyjiang <chaunceyjiang@gmail.com>	2024-11-04 15:34:57 +00:00
Mengqing Cao	ccb5376a9a	[Bugfix][OpenVINO] Fix circular reference #9939 (#9974 ) Signed-off-by: MengqingCao <cmq0113@163.com>	2024-11-04 18:14:13 +08:00
Tran Quang Dai	ea4adeddc1	[Bugfix] Fix E2EL mean and median stats (#9984 ) Signed-off-by: daitran2k1 <tranquangdai7a@gmail.com>	2024-11-04 09:37:58 +00:00

1 2 3 4 5 ...

3287 Commits