00:00 / 01:44
连播
清屏
智能
倍速
点赞20
00:00 / 05:50
连播
清屏
智能
倍速
点赞13
00:00 / 02:46
连播
清屏
智能
倍速
点赞50
让模型快 10 倍的秘密:深度学习编译器 IR 核心 # 让模型快 10 倍的秘密:深度学习编译器 IR 核心 1. IR 的本质是内存中的数据结构(Python 对象或 C++ 对象),编译期存在并优化,运行期消失实现零开销 2. 采用多层次架构设计:高层 IR 保留框架语义、中层 IR 跨平台抽象、低层 IR 硬件映射,渐进式降低 3. MLIR 是编译器基础设施,特点是可扩展方言系统、多层次抽象和强大 Pass 框架,适合构建新编译器和硬件适配 4. HLIR/HLO 是 XLA 编译器核心,提供算子级抽象和强大融合能力,是 TensorFlow/JAX 的原生编译路径,TPU 优化首选 5. Inductor IR 是 PyTorch 2.0 编译引擎,一行代码(torch.compile)即可启用,具备自动融合、内存优化和动态 Shape 支持 6. FX IR 是 Python 友好的图表示系统,完全基于 Python 对象,易于调试和修改,是 PyTorch 量化和图分析的核心工具 7. PyTorch 用户:性能优化用 Inductor,模型量化和图变换用 FX IR 8. TensorFlow/JAX 用户:统一使用 HLIR/HLO(XLA 编译路径),TPU 加速的最佳选择 9. 编译器开发者:构建新编译器或硬件适配选择 MLIR 10. 实际项目可混合使用:FX 高层优化 → Inductor 代码生成 → ONNX 部署 11. 性能对比:MLIR 和 Inductor 优化能力最强(★★★★★),Inductor 动态 Shape 支持最好(★★★★★),FX IR 学习曲线最平缓 12. 未来趋势:MLIR 成为统一生态标准、AI 辅助编译优化、更好的动态编译技术、异构计算多硬件优化 13. 编译优化通常能带来 1.5-10 倍性能提升,"编译一次,运行多次"是核心价值 14. 深入理解 IR 是掌握深度学习编译器的关键,IR 是连接模型和性能的核心桥梁 #pytorch #编译器 #大模型
00:00 / 13:14
连播
清屏
智能
倍速
点赞8
00:00 / 03:45
连播
清屏
智能
倍速
点赞22
00:00 / 03:52
连播
清屏
智能
倍速
点赞37
00:00 / 00:34
连播
清屏
智能
倍速
点赞4524
00:00 / 02:08
连播
清屏
智能
倍速
点赞15
00:00 / 02:52
连播
清屏
智能
倍速
点赞277
00:00 / 01:30
连播
清屏
智能
倍速
点赞3
00:00 / 00:52
连播
清屏
智能
倍速
点赞5
00:00 / 07:15
连播
清屏
智能
倍速
点赞8
00:00 / 02:38
连播
清屏
智能
倍速
点赞4109
00:00 / 01:39
连播
清屏
智能
倍速
点赞15
00:00 / 07:47
连播
清屏
智能
倍速
点赞77
33.python从入门到精通之 函数的返回值 # Python从入门到精通:常用函数(500字核心简介) 函数是Python编程的“效率积木”,掌握常用函数不仅能简化代码,更是从“零散写代码”到“模块化编程”的关键,也是从入门到精通的核心抓手。 Python常用函数可分为两类,覆盖入门到进阶全场景: 1. **内置函数(入门必掌握)**:无需导入模块即可直接使用,是新手入门的基础。比如`print()`(输出内容)、`input()`(获取用户输入)是交互类核心;`len()`(统计长度)、`range()`(生成序列)常用于循环;`type()`(判断数据类型)、`int()/str()`(类型转换)解决数据格式问题;`max()/min()`(找最值)、`sum()`(求和)则是数值处理的常用工具。这些函数覆盖80%的入门场景,吃透就能完成猜数字、数据统计等基础项目。 2. **模块封装函数(进阶核心)**:需导入对应模块使用,是精通Python的关键。比如`math`模块的`math.sqrt()`(开平方)、`math.ceil()`(向上取整)满足数学计算;`os`模块的`os.path.exists()`(判断文件是否存在)、`os.mkdir()`(创建文件夹)处理文件操作;`requests`模块的`requests.get()`(发送网络请求)实现爬虫/接口调用;`pandas`模块的`pd.read_csv()`(读取文件)则是数据分析的核心函数。 从入门到精通的学习逻辑:先熟练内置函数,理解“函数是功能封装”的本质;再通过模块函数拓展能力边界,学会“按需导入、灵活调用”;最终能自定义函数(用`def`定义),将重复逻辑封装成专属函数,甚至通过类和装饰器优化函数,实现代码复用与高效维护。 常用函数的学习核心不是死记硬背,而是理解“函数的输入(参数)-处理-输出(返回值)”逻辑,结合实际场景(如数据处理、文件操作)反复练习,就能从“会用函数”到“用好函数”,真正掌握Python编程的核心思维。#Python#python编程#python基础#python教学#python人工智能
00:00 / 14:52
连播
清屏
智能
倍速
点赞17
00:00 / 00:20
连播
清屏
智能
倍速
点赞0