【Hackathon 9th】开源贡献个人挑战赛 (original) (raw)

20

0.1🌟

自定义算子 masked_per_token_quant 单测补充

@ooooo-create #4111

@ooooo-create

21

0.1🌟

自定义算子 moe_fused_hadamard_quant_fp8 单测补充

@ooooo-create #4094

@ooooo-create

22

0.1🌟

自定义算子 share_external_data 单测补充

@ddsfda99
@ooooo-create #3744

@ooooo-create

23

0.1🌟

自定义算子 fused_hadamard_quant_fp8 单测补充

@ooooo-create #4094

@ooooo-create

24

0.1🌟

自定义算子 rebuild_padding 单测补充

@co63oc #4107

@co63oc

25

0.1🌟

自定义算子 fused_get_rotary_embedding 单测补充

@Echo-Nie #3892

@Echo-Nie

26

0.1🌟

自定义算子 set_value_by_flags_and_idx 单测补充

@ooooo-create #3738
@Echo-Nie #4186

@Echo-Nie

27

0.1🌟

自定义算子 get_padding_offset 单测补充

@co63oc #3708

@co63oc

28

0.1🌟

自定义算子 cutlass_fp8_fp8_fp8_dual_gemm_fused 单测补充

@WanRui37 #3935

@WanRui37

29

0.1🌟

自定义算子 cutlass_fp8_fp8_half_block_gemm_fused 单测补充

@ooooo-create #4096

30

0.1🌟

自定义算子 tritonmoe_preprocess 单测补充

@Echo-Nie #3891

@Echo-Nie

31

0.1🌟

自定义算子 gptq_marlin_repack 单测补充

@wandering-tiger

32

0.1🌟

自定义算子 group_swiglu_with_masked 单测补充

@ooooo-create #3748

@ooooo-create

33

0.1🌟

自定义算子 moe_wna16_marlin_gemm 单测补充

@wandering-tiger

34

0.1🌟

自定义算子 get_position_ids_and_mask_encoder_batch 单测补充

@Echo-Nie #3739

@Echo-Nie

35

0.1🌟

自定义算子 masked_per_token_quant 单测补充

@Echo-Nie #3867

@Echo-Nie

36

0.1🌟

自定义算子 extract_text_token_output 单测补充

@ddsfda99
@Echo-Nie #3862

@Echo-Nie

37

0.1🌟

自定义算子 top_k_renorm_probs 单测补充

@Echo-Nie #3755

@Echo-Nie

38

0.1🌟

自定义算子 winx_unzip 单测补充

@Echo-Nie #3910

39

0.1🌟

自定义算子 moe_expert_ffn_wint2 单测补充

40

0.1🌟

自定义算子 top_p_candidates 单测补充

@co63oc #4046

@co63oc

41

0.1🌟

自定义算子 speculate_update_v2 单测补充

@co63oc #3940

@co63oc

42

0.1🌟

自定义算子 speculate_get_output_padding_offset 单测补充

@co63oc #3740

@co63oc

43

0.1🌟

自定义算子 speculate_get_seq_lens_output 单测补充

@co63oc #3730

@co63oc

44

0.1🌟

自定义算子 speculate_get_token_penalty_multi_scores 单测补充

@co63oc #3742

@co63oc

45

0.1🌟

自定义算子 speculate_get_padding_offset 单测补充

@co63oc #3730

@co63oc

46

0.1🌟

自定义算子 fused_rotary_position_encoding 单测补充

@Echo-Nie #3848

@Echo-Nie

47

0.1🌟

自定义算子 append_attention 单测补充

@aztice

48

0.1🌟

自定义算子 ep_moe_expert_dispatch_fp8 单测补充

@G2uge #4426

49

0.1🌟

自定义算子 pre_cache_len_concat 单测补充

@Echo-Nie #3847

@Echo-Nie

50

0.1🌟

自定义算子 ep_moe_expert_dispatch 单测补充

@G2uge #4422
@xilzy #4540

51

0.1🌟

自定义算子 masked_per_token_quant 单测补充

52

0.1🌟

自定义算子 dynamic_per_token_scaled_fp8_quant 单测补充

@co63oc #4015

@co63oc

53

0.1🌟

自定义算子 multi_head_latent_attention 单测补充

@co63oc
@playasdw #4328

54

0.1🌟

自定义算子 per_token_quant 单测补充

@ooooo-create #3746

@ooooo-create

55

0.1🌟

自定义算子 update_inputs_v1 单测补充

@co63oc #3992

@co63oc

56

0.1🌟

自定义算子 get_data_ptr_ipc 单测补充

@ooooo-create #3744 #3874

57

0.1🌟

自定义算子 per_token_quant_padding 单测补充

@ooooo-create #3746

@ooooo-create

58

0.1🌟

自定义算子 speculate_rebuild_append_padding 单测补充

59

0.1🌟

自定义算子 speculate_set_value_by_flags_and_idx 单测补充

@ooooo-create #3738

60

0.1🌟

自定义算子 eagle_get_self_hidden_states 单测补充

@co63oc #3876

@co63oc

61

0.1🌟

自定义算子 speculate_update_v3 单测补充

@co63oc #3875 #3940

@co63oc

62

0.1🌟

自定义算子 eagle_get_hidden_states 单测补充

@co63oc #3876

@co63oc

63

0.1🌟

自定义算子 draft_model_postprocess 单测补充

@co63oc #3757

@co63oc

64

0.1🌟

自定义算子 draft_model_set_value_by_flags 单测补充

@Echo-Nie #3741

@Echo-Nie

65

0.1🌟

自定义算子 draft_model_update 单测补充

@co63oc #3940

@co63oc

66

0.1🌟

自定义算子 speculate_set_stop_value_multi_seqs 单测补充

@co63oc #3941

@co63oc

67

0.1🌟

自定义算子 speculate_verify 单测补充

@co63oc #4326

@co63oc

68

0.1🌟

自定义算子 ngram_match 单测补充

@Echo-Nie #3732

@Echo-Nie

69

0.1🌟

自定义算子 draft_model_preprocess 单测补充

@co63oc #3832

@co63oc

70

0.1🌟

功能模块 CUDAPlatform、CPUPlatform 单测补充

@Echo-Nie #3580

@Echo-Nie

71

0.1🌟

功能模块 WeightOnlyLinearMethod 单测补充

@Echo-Nie #4109

72

0.1🌟

功能模块 Worker/ModelRunner 单测补充

@Echo-Nie #3576

73

0.1🌟

功能模块 graph_optimization 单测补充

@ooooo-create #3609

@ooooo-create

74

0.1🌟

功能模块 fastdeploy/cache_manager/RDMACommManager 单测补充

75

0.1🌟

功能模块 fastdeploy/cache_manager/IPCCommManager 单测补充

76

0.1🌟

功能模块 fastdeploy/model_executor/guided_decoding/XGrammarChecker 单测补充

@Echo-Nie #3560 #4075

@Echo-Nie

77

0.1🌟

功能模块 fastdeploy/metrics/metrics/get_filtered_metrics 单测补充

@Echo-Nie #3578

@Echo-Nie

78

0.1🌟

功能模块 fastdeploy/entrypoints 单测补充

@co63oc #3958

@co63oc

79

0.1🌟

功能模块 fastdeploy/entrypoints/openai 单测补充

@playasdw #4281 #4327

80

0.1🌟

功能模块 fastdeploy/splitwise 单测补充

@Dayuxiaoshui

81

0.1🌟

功能模块 fastdeploy/output 单测补充

@xilzy

82

0.1🌟

功能模块 fastdeploy/cache_manager 单测补充

@Echo-Nie #3737

83

0.1🌟

功能模块 fastdeploy/model_executor/models 单测补充

@Dayuxiaoshui

84

0.1🌟

功能模块 fastdeploy/reasoning/ 单测补充

@Echo-Nie #3570

@Echo-Nie

85

0.1🌟

功能模块 fastdeploy/inputs/ 单测补充

@xilzy #4540

86

⭐⭐⭐

FastDeploy编译加速

@ccsuzzh #1153 #4256 #4330 #4383 #4592

@ccsuzzh

87

⭐⭐

为FastDeploy增加Profiler模块

88

⭐⭐

为FastDeploy重构log日志打印范式

89

⭐⭐

为FastDeploy集成 SageAttn v2/2++

@WanRui37
@fangfangssj #1157

90

⭐⭐

为FastDeploy集成 SpargeAttn

@fangfangssj
@Le-soleile

91

⭐⭐

FastDeploy中的MoE GroupGEMM支持INT8*INT8实现

@WanRui37 #1164

92

⭐⭐

为 FastDeploy 新增 K2模型

@ZhijunLStudio

93

⭐⭐

为 FastDeploy 新增 MiniMax-M1模型

@ZhijunLStudio #4095 #1156 #4409 #4629

94

⭐⭐⭐

为 FastDeploy 新增 SD、Flux扩散模型

@ZhijunLStudio
@kitalkuyo-gita #75151 #4021

95

⭐⭐

为 FastDeploy 新增 MTP 的 Multi-layer功能

@xiaohajiayou

96

⭐⭐⭐

为FastDeploy新增MLA的FP8版本实现