copy and paste this google map to your website or blog!
Press copy button and paste into your blog or website.
(Please switch to 'HTML' mode when posting into your blog. Examples: WordPress Example, Blogger Example)
华为昇腾920后续会接入OpenAI开源的Triton编程语言么吗? 感觉比较困难,因为triton很核心的tensor类编程要求了tensor和vector能力的交互。而npu本质还是加速器,编程能力不强。 2024 May 24更新如下 有希望,因为Ascend的整体编程模型是SPMD(Single Program Multiple Data)这和triton是一致的,对于耦合架构而言,tensor vector的交互似乎也解决了。但整个compiler工程的工作量
Triton中LoadOp是怎么从TTGIR Lowering到LLVM Dialect上的? 并且NV中的向量指令最大每个thread只支持到128-bit,故f32的vec再连续也不会超过4。 做一个邪恶的小实验,让AxisInfo Pass连续性分析失效,重新编译Triton, 我们可以看到已经不会再生成ld global v4 b32向量指令了~但结果仍然是正确的~~(全文完)