人工智能

简介
目录大纲
最新文档

CUDA 高性能计算

GPU的硬件架构以A100为例一个GPU 又108个SM，每个SM 中有64个FP32cuda core 4个tensor core，计算卡上还有8个FP16 cudacore; 被分为4个warp,每个warp有有l0指令缓存区，寄存器文件16384个，寄存器文件大小32bit A100每个SM上面的占有率有如下受限因素：线程块数量2个每个线程块中最多运行的线程数量1024 所有……

jays - 2024年2月2日 20:52

tensorflow性能调优

1.性能指南当训练一个机器学习模型时，性能是个大问题。该指南包含了一些优化tensorflow代码的最佳实践。分为几个部分：常用最佳实际：覆盖了多种模型类型和硬件的主题 GPU优化：与GPUs相关 CPU优化：CPU相关 2.通用最佳实践 2.1 input pipeline优化常见模型会从磁盘中抽取数据，进行预处理，然后通过网络发送数据。例如，处理JPEG图片的模型会有下面的流程：从磁盘加……

jays - 2024年2月2日 20:33

首先我要说的是，这篇文章并不是对法学硕士的回顾。显然，2023 年对于人工智能来说是特殊的一年：重申这一点似乎毫无意义。相反，这篇文章的目的是作为一名程序员个人的见证。自从 ChatGPT 出现以来，以及后来通过使用本地运行的法学硕士，我广泛使用了这项新技术。目标是提高我编写代码的能力，但这不是唯一的目的。还有一个目的是不要将精力浪费在不值得付出努力的编程方面。花费了无数的时间来寻找有关奇特的、智……

jays - 2024年1月14日 19:28

人工智能

CUDA 高性能计算

tensorflow性能调优

大语言模型和AI编程