人工智能


  • 简介
  • 目录大纲
  • 最新文档

    CUDA 高性能计算

    GPU的硬件架构 以A100为例 一个GPU 又108个SM,每个SM 中有64个FP32cuda core 4个tensor core,计算卡上还有8个FP16 cudacore; 被分为4个warp,每个warp有有l0指令缓存区, 寄存器文件16384个,寄存器文件大小32bit A100每个SM上面的占有率有如下受限因素: 线程块数量2个 每个线程块中最多运行的线程数量1024 所有……

    jays - 2024年2月2日 20:52


    tensorflow性能调优

    1.性能指南 当训练一个机器学习模型时,性能是个大问题。该指南包含了一些优化tensorflow代码的最佳实践。分为几个部分: 常用最佳实际:覆盖了多种模型类型和硬件的主题 GPU优化:与GPUs相关 CPU优化:CPU相关 2.通用最佳实践 2.1 input pipeline优化 常见模型会从磁盘中抽取数据,进行预处理,然后通过网络发送数据。例如,处理JPEG图片的模型会有下面的流程:从磁盘加……

    jays - 2024年2月2日 20:33


    大语言模型和AI编程

    首先我要说的是,这篇文章并不是对法学硕士的回顾。显然,2023 年对于人工智能来说是特殊的一年:重申这一点似乎毫无意义。相反,这篇文章的目的是作为一名程序员个人的见证。自从 ChatGPT 出现以来,以及后来通过使用本地运行的法学硕士,我广泛使用了这项新技术。目标是提高我编写代码的能力,但这不是唯一的目的。还有一个目的是不要将精力浪费在不值得付出努力的编程方面。花费了无数的时间来寻找有关奇特的、智……

    jays - 2024年1月14日 19:28



    jays