PyTorch官宣 GPU推理迎来Triton加速新时代 告别CUDA 新智元报道,乔杨Frey,新智元导读,用英伟达的GPU,但可以不用CUDA,PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能,试...