Как установить cudnn в windows 10

Перевод   Ссылка на автора


  Перевод


  Ссылка на автора

В Часть 1 В этой серии я рассказал о том, как вы можете модернизировать аппаратное обеспечение своего ПК, добавив в него видеокарту, совместимую с CUDA Toolkit, например графический процессор Nvidia. В этой части 2 рассматривается установка CUDA, cuDNN и Tensorflow в Windows 10. В данной статье предполагается, что на вашем компьютере уже установлен CUDA-совместимый графический процессор; но если у вас этого еще нет, Часть 1 из этой серии поможет вам настроить аппаратное обеспечение, готовое к этим шагам.

Шаг 1: Проверьте программное обеспечение, которое вам нужно установить

Предполагая, что Windows уже установлена ​​на вашем ПК, дополнительные части программного обеспечения, которые вы установите в рамках этих шагов: —

  • Microsoft Visual Studio
  • инструментарий NVIDIA CUDA
  • NVIDIA cuDNN
  • питон
  • Tensorflow (с поддержкой GPU)

Шаг 2: Загрузите Visual Studio Express

Visual Studio является обязательным условием для CUDA Toolkit

Visual Studio требуется для установки Nvidia CUDA Toolkit (это обязательное условие Вот). Если вы попытаетесь загрузить и установить CUDA Toolkit для Windows без предварительной установки Visual Studio, вы получите сообщение, показанное на рис. 1.

Рисунок 1: Сообщение при попытке установить CUDA Toolkit без Visual Studio

Выбор и загрузка Visual Studio Express

На момент написания этой статьи самой последней версией Visual Studio (которая является бесплатной) является Visual Studio Express Community Version 2017, показанная на рис. 2. Предыдущие версии Visual Studio можно бесплатно получить, присоединившись к « Visual Studio Dev Essentials ”И затем ищите нужную версию Visual Studio.

Рис 2: Visual Studio Community 2017 (бесплатно)

Установка Visual Studio Express

После того, как вы загрузили Visual Studio Express, его установка проста. На рис. 3 показан исполняемый файл, который вы получаете в качестве загрузки.

Рисунок 3: Исполняемый файл сообщества Visual Studio

Когда вы нажимаете опцию «сохранить файл» на рис. 3, появляется окно на рис. 4, где вы можете установить параметры установки (или просто оставить их, как они есть по умолчанию, как я).

Рисунок 4: окно установки для Visual Studio Community 2017

Во время установки Visual Studio предложит вам whetherхочу продолжить без нагрузки». Я нажал «продолжить», поскольку не собирался использовать рабочие нагрузки вообще.

Рис. 5. Я не добавил рабочие нагрузки при запросе Visual Studio

Может потребоваться перезагрузка компьютера после установки Visual Studiod

После установки Visual Studio я сразу перешел к загрузке и попытке установить CUDA Toolkit для Windows — этот шагШаг 3который я буду описывать дальше. Я получил сообщение, чтоVisual Studio все еще работала и препятствовала установке CUDA Toolkit, Перезагрузка моего компьютера перед попыткой установки CUDA Toolkit снова решила эту проблему.


Шаг 3: Загрузите CUDA Toolkit для Windows 10

Эти шаги установки CUDA основаны на Руководство по установке Nvidia CUDA для Windows, Набор инструментов CUDA (бесплатный) можно загрузить с веб-сайта Nvidia Вот,

На момент написания по умолчанию предлагается версия CUDA Toolkit версии 10.0, как показано на рис. 6. Однако вам следует проверить, какую версию CUDA Toolkit вы выбрали для загрузки и установки, чтобы обеспечить совместимость с Tensorflow (в будущемШаг 7этого процесса). Когда вы идете на Веб-сайт Tensorflow, последняя доступная версия Tensorflow (1.12.0) требуетCUDA 9.0не CUDA 10.0. Чтобы найти CUDA 9.0, вам нужно перейти к «Legacy Releases» в нижней правой части рисунка 6.

Рис. 6. По умолчанию (самая последняя) версия CUDA для Windows — cuda_10.0.130_411.31_win10.exe. Для CUDA 9.0 выберите «Legacy Releases»

Шаг 3.1: Загрузка CUDA 9.0 из архива инструментария CUDA

Выбрав «Legacy Releases», вы попадете в архив CUDA Toolkit. На основе Установка Tensorflow В соответствии с указаниями, требуемая версия CUDA — 9.0, как показано на Рис. 7.

Рис. 7. Список заархивированных выпусков CUDA, доступных для скачивания — CUDA Toolkit 9.0 (сентябрь 2017 г.)

Шаг 3.2: Установка CUDA 9.0

CUDA 9.0 поставляется как базовая установка и четыре патча; Сначала необходимо установить базовую версию CUDA 9.0, а затем патчи. Варианты базовой установки, которые я выбрал, показаны на рис. 8.

Рис. 8. Параметры, выбранные для базовой установки CUDA 9.0 для базового установщика Windows

Запуск только что загруженного базового установщика приведет к появлению окна CUDA Setup Package, как показано на рисунке 9.

Рис. 9. Пакет установки CUDA для базового установщика CUDA

Программа установки CUDA извлекает данные на ваш компьютер, и после завершения начнется установка NVIDIA CUDA Toolkit; вы получите сообщение об этом Полученные окна установщика NVIDIA на протяжении всего процесса установки показаны на Рис. 10 — Рис. 13. Я выбрал вариант быстрой установки (Рис. 10).

Рис. 10. Варианты установки базового установщика CUDA 9.0 — я выбрал вариант Express

Рис. 11 дает возможность выбрать место установки; Я выбрал расположение по умолчанию, которое для CUDA:

C:Program FilesNVIDA GPU Computing ToolkitCUDAv9.0

Рис. 11. Установка базы CUDA 9.0 — выбор места установки CUDA

На рисунке 12 ниже показаны установки CUDA, основанные на Visual Studio, ранее установленной вШаг 1,

Рисунок 12: Базовый процесс установки CUDA 9.0 — окно, показывающее установки, основанные на Visual Studio

Нажатие «Далее» в окне, показанном на рис. 12 выше, дает окно окончательной установки, показанное как рис. 13 ниже, где установщик NVIDIA отмечен как завершенный.

Рис. 13: Окончательное окно установки для базового установщика CUDA 9.0

Шаг 4: Загрузите исправления CUDA для Windows 10

На момент написания этой книги было четыре патча CUDA (а также базовый установщик), так что давайте пойдем и загрузим их. Они показаны на фиг.14.

Рисунок 14: Загрузка и установка дополнительных четырех патчей для CUDA 9.0

Когда четыре исправления загружены, их можно установить так же, как и базовый установщик — с окнами установки, обеспечивающими руководство по процессу.


Шаг 5: Загрузите и установите cuDNN

После установки базового установщика CUDA 9.0 и его четырех исправлений следующим шагом будет поиск совместимой версии CuDNN. Основываясь на информации на веб-сайте Tensorflow, для поддержки Tensorflow с графическим процессором требуется версия cuDNN по адресу минимум 7,2,

Шаг 5.1: Загрузка cuDNN

Для того, чтобы скачать CuDNN Вы должны зарегистрироваться, чтобы стать участником программы разработчиков NVIDIA (которая бесплатна).

Рис. 15: Создание бесплатной учетной записи для загрузки cuDNN.

Когда вы создаете учетную запись, входите в систему и заполняете некоторые другие необходимые сведения о том, почему вы используете учетную запись, вы получаете страницу загрузки, показанную на рис. 16.

Рис 16: страница загрузки cuDNN с выбором cuDNN v.7.4

Поскольку я скачал CUDA 9.0, соответствующая версия cuDNN — это версия 7.4.2. Выбор cuDNN версии 7.4.2 разрешает загрузку в виде zip-файла с именем следующим образом:

cudnn-9.0-windows10-x64-v7.zip 

Шаг 5.2: Распаковка файлов cuDNN и копирование в папки CUDA

инструкции на нвидии обеспечить поддержку установки windows cuDNN, как и инструкции на веб-сайте Tensorflow; Я воспроизвел эти инструкции в дистиллированном виде, основываясь на своей реализации. В моем случае я загрузил названный выше файл cuDNN .zip в папку с следующим путем на моем ПК (ваш путь, без сомнения, будет другим).

C:UsersjoDocumentscuDNN_downloads

В приведенных ниже инструкциях я ссылаюсь на путь к папке «C: Users жо Documents cuDNN_downloads »(Упоминается чуть выше) как«», Такой, что zip-файл теперь находится в пути:

<downloadpath>cudnn-9.0-windows10-x64-v7.5.0.56.zip

Я разархивировал файл cuDNN «.zip», в который я его скачал, поэтому структура разархивированной папки, которая будет содержать необходимые файлы cuDNN, теперь: —

<downloadpath>cudnn-9.0-windows10-x64-v7.5.0.56

В разархивированных подкаталогах папки cuDNN находятся три файла, которые нужно скопировать в каталоги CUDA Toolkit. Это cudnn64_7.dll, cudnn.h и:

1. cudnn64_7.dll

cudnn64_7.dll можно найти по следующему пути в загруженных файлах cuDNN:

<downloadpath>cudnn-9.0-windows10-x64-v7.5.0.56cudabincudnn64_7.dll

Предполагая, что вы установили CUDA 9.0 по пути по умолчанию (как я сделал вШаг 2.3), а именно следующий путь по умолчанию:

C:Program FilesNVIDA GPU Computing ToolkitCUDAv9.0

Вы можете скопироватьcudnn64_7.dllфайл прямо в папку CUDAбункерПуть к папке (примечание: вам не нужно создавать какие-либо новые подпапки):

C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0bin

2. cudnn.h

Как и в случае с файлом cudnn64_7.dll, приведенным выше, после загрузки и разархивирования папки cuDNN файл заголовкаcudnn64.hможно найти в пути:

<downloadpath>cudnn-9.0-windows10-x64-v7.5.0.56cuda includecudnn.h

Опять же, предполагая, что вы установили CUDA 9.0 в путь по умолчанию, как я сделал вШаг 2.3скопироватьcudnn.hнепосредственно в папку CUDA по следующему пути (новые подпапки не нужны):

C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0include

3. cudnn.lib

.Lib файлcudnn.libможно найти в загруженном пути cuDNN:

<downloadpath>cudnn-9.0-windows10-x64-v7.5.0.56cudalibx64cudnn.lib

Скопируйте cudnn.lib непосредственно в папку CUDA по следующему пути:

C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0libx64

Шаг 5.3: Проверка того, что переменные среды CUDA установлены в Windows

Наконец, инструкции на нвидии убедитесь, что вы ранее установили переменную среды CUDA следующим образом:

Variable Name: CUDA_PATH 
Variable Value: C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0

В Windows 10 переменные среды можно найти, выбрав:

Панель управления->Система и безопасность->система->Расширенные настройки системы,

Откроется окно «Свойства системы» (рис. 17), в котором следует выбрать кнопку «Переменные среды».

Рис. 17. Кнопка «Переменные среды» (в окне «Свойства системы») для настройки и проверки путей CUDA

Когда появится окно «Переменные среды», в «системных переменных» (в нижней половине окна) нажмите «Путь» и нажмите кнопку «Изменить». Появится новое окно под названием «Редактировать переменную среды», как показано на рисунке 18 ниже.

При проверке переменных среды я обнаружил процесс установки, который определяет путь установки CUDA —Шаг 3.2см. рис. 11 — уже добавлены два пути к CUDA. Эти пути показаны на рисунке 18 ниже, поэтому я обнаружил, что мне не нужно добавлять дополнительный путь CUDA.

Рис. 18. Пути по умолчанию, ранее созданные в процессе установки CUDA 9.0

Шаг 6: Установите Python (если у вас его еще нет)

Теперь, когда CUDA и cuDNN установлены, пришло время установить Python для последующей установки Tensorflow. На момент написания самой последней доступной версии Python 3 является Python 3.7, но Версии Python 3, необходимые для Tensorflow: 3.4, 3.5 или 3.6, Python 3.6 можно загрузить для Windows 10 с Вот, Когда вы запустите установщик Python для окон, появится окно настройки на Рис. 19.

Рис. 19: экран установки Python 3.6; Я выбираю все дополнительные функции на этом экране (pip и IDLE оба используются в последующих шагах)

Из вариантов, показанных на рис. 19 выше, во время установки Python я решил выбрать все из них. Эти параметры полезны: установщик Python «pip» используется наШаг 7.2этого руководства по установке Tensorflow. Кроме того, я использую IDE (интегрированную среду разработки для написания и запуска кода Python) под названием «IDLE» вШаг 8,

В «Расширенных настройках» (показанных на Рис. 20 ниже) я выбрал установку Python для всех пользователей (которая не была отмечена по умолчанию); это дает более полезную системную установку.

Рис. 20. Дополнительные параметры, доступные при установке Python 3.6

Шаг 7: Установите Tensorflow с поддержкой GPU

Tensorflow предоставляет инструкции для проверки правильности добавления каталогов установки CUDA, cuDNN и (необязательно: CUPTI) в переменные среды PATH. Поскольку три файла cuDNN были скопированы в подпапки CUDA, я не обновил существующий путь переменных среды CUDA.

Шаг 7.1: вызов командной строки с правами администратора

На этом этапе выполняется общесистемная установка Tensorflow, а не установка для каждого пользователя. Общесистемная установка Tensorflow требует прав администратора, поэтому, соответственно, командная строка должна запускаться с правами администратора.

Откройте командную строку, запустив ‘CMD’В строке поиска, а затем щелкните правой кнопкой мыши в командной строке, чтобы выбрать« Запуск от имени администратора ». Это открывает Администратор: Командная строка, как показано на рисунке 21.

Рис. 21. Запуск командной строки от имени администратора из панели поиска Windows 10

Шаг 7.2: Общесистемная установка Tensorflow через Python pip

После открытия командной строки общесистемная команда установки для Tensorflow с поддержкой GPU выглядит следующим образом:

pip3 install --upgrade tensorflow-gpu

Команда «pip3» (в отличие от «pip») требуется, так как установка выполняется в Python 3. Выполнение этой команды в командной строке показано на рисунке 22.

Рисунок 22: Команда установки Pip для Tensorflow с поддержкой GPU

Результирующий вывод команды показан на рисунке 23, и, если все пойдет по плану, в конечном итоге должно появиться сообщение, подтверждающее, что Tensorflow был успешно установлен.

Рис. 23. Сообщения командной строки, отображаемые после успешной установки Tensorflow GPU 1.12.0.

Шаг 8: Тестовая установка TensorFlow и его доступ к GPU

Перейдите в меню «Пуск» в Windows и найдите среду IDE с именем «idle», которая будет установлена ​​как часть вашей установки на python, если вы выбрали, как я сделал вШаг 6, Окно Python должно появиться с надписьюОболочка Python 3.6.x, По приглашению (обозначается как «>>>») импортируйте пакет Tensorflow. Это проверит, что Tensorflow был установлен (как вы можете импортировать его). Команда для оболочки IDLE для импорта пакета tenorflow выглядит следующим образом:

# importing the tensorflow package
import tensorflow as tf

Чтобы проверить поддержку CUDA для вашей установки Tensorflow, вы можете запустить в командной строке следующую команду:

tf.test.is_built_with_cuda()

Наконец, чтобы убедиться, что графический процессор доступен для Tensorflow, вы можете протестировать, используя встроенную служебную функцию в TensorFlow, как показано Вот:

tf.test.is_gpu_available(cuda_only=False, min_cuda_compute_capability=None)

Требуется несколько минут, чтобы вернуть результат из этого; когда он закончен, он возвращаетсяПравда, а затем приглашение>>>`появляется снова. Импортирование тензорного потока и эти тесты показаны на рис. 24 в оболочке Python IDLE.

Рис. 24. Использование IDLE Python IDE для проверки того, что Tensorflow был построен с CUDA и доступен ли графический процессор

Выводы

Это были шаги, которые я предпринял для установки Visual Studio, CUDA Toolkit, CuDNN и Python 3.6, и все с конечной целью установки Tensorflow с поддержкой GPU в Windows 10. На сегодняшний день моя работа по машинному обучению и глубокому обучению на основе GPU была в Linux Машины с Ubuntu; к тому же, большая часть онлайновой поддержки сообщества машинного обучения фокусируется на Ubuntu

Для машинного обучения основным недостатком использования Windows является то, что необходимо создавать больше объектов из исходного кода (например, используя Cmake), чем в Linux, а также для установки дополнительного программного обеспечения для процессов сборки, таких как Visual Studio. Например, если бы вы установить Caffe2 в Windows нет встроенных двоичных файлов, и сборка Windows находится в тестовом и бета-режиме. Я установил CUDA и cuDNN на Windows 10 более любопытно, чем что-либо еще, просто чтобы посмотреть, насколько это было просто (или иначе).

Как я намекал в Часть 1 Теперь, когда CUDA, cuDNN и Tensorflow успешно установлены в Windows 10, и я проверил доступ Tensorflow к графическому процессору, я собираюсь смести всю операционную систему Windows 10, чтобы произвести новую установку Ubuntu 18.04 LTS. Эта новая установка Ubuntu будет рассмотрена в части 3 этой серии.

Эта статья также была опубликована Вот в моем собственном блоге.

В очередной раз после переустановки Windows осознал, что надо накатить драйвера, CUDA, cuDNN, Tensorflow/Keras для обучения нейронных сетей.

Каждый раз для меня это оказывается несложной, но времязатратной операцией: найти подходящую комбинацию Tensorflow/Keras, CUDA, cuDNN и Python несложно, но вспоминаю про эти зависимости только в тот момент, когда при импорте Tensorflow вижу, что видеокарта не обнаружена и начинаю поиск нужной страницы в документации Tensorflow.

В этот раз ситуация немного усложнилась. Помимо установки Tensorflow мне потребовалось установить PyTorch. Со своими зависимостями и поддерживаемыми версиями Python, CUDA и cuDNN.

По итогам нескольких часов экспериментов решил, что надо зафиксировать все полезные ссылки в одном посте для будущего меня.

Краткий алгоритм установки Tensorflow и PyTorch

Примечание: Установить Tensorflow и PyTorch можно в одном виртуальном окружении, но в статье этого алгоритма нет.

Подготовка к установке

  1. Определить какая версия Python поддерживается Tensorflow и PyTorch (на момент написания статьи мне не удалось установить PyTorch в виртуальном окружении с Python 3.9.5)
  2. Для выбранной версии Python найти подходящие версии Tensorflow и PyTorch
  3. Определить, какие версии CUDA поддерживают выбранные ранее версии Tensorflow и PyTorch
  4. Определить поддерживаемую версию cuDNN для Tensorflow – не все поддерживаемые CUDA версии cuDNN поддерживаются Tensorflow. Для PyTorch этой особенности не заметил

Установка CUDA и cuDNN

  1. Скачиваем подходящую версию CUDA и устанавливаем. Можно установить со всеми значениями по умолчанию
  2. Скачиваем cuDNN, подходящую для выбранной версии Tensorflow (п.1.2). Для скачивания cuDNN потребуется регистрация на сайте NVidia. “Установка” cuDNN заключается в распакове архива и заменой существующих файлов CUDA на файлы из архива

Устанавливаем Tensorflow

  1. Создаём виртуальное окружение для Tensorflow c выбранной версией Python. Назовём его, например, py38tf
  2. Переключаемся в окружение py38tf и устанавливаем поддерживаемую версию Tensorflow pip install tensorflow==x.x.x
  3. Проверяем поддержку GPU командой
    python -c "import tensorflow as tf; print('CUDA available' if tf.config.list_physical_devices('GPU') else 'CUDA not available')"
    

Устанавливаем PyTorch

  1. Создаём виртуальное окружение для PyTorch c выбранной версией Python. Назовём его, например, py38torch
  2. Переключаемся в окружение py38torch и устанавливаем поддерживаемую версию PyTorch
  3. Проверяем поддержку GPU командой
python -c "import torch; print('CUDA available' if torch.cuda.is_available() else 'CUDA not available')"

В моём случае заработала комбинация:

  • Python 3.8.8
  • Драйвер NVidia 441.22
  • CUDA 10.1
  • cuDNN 7.6
  • Tensorflow 2.3.0
  • PyTorch 1.7.1+cu101

Tensorflow и PyTorch установлены в разных виртуальных окружениях.

Итого

Польза этой статьи будет понятна не скоро: систему переустанавливаю я не часто.

Если воспользуетесь этим алгоритмом и найдёте какие-то ошибки – пишите в комментарии

Если вам понравилась статья, то можете зайти в мой telegram-канал. В канал попадают небольшие заметки о Python, .NET, Go.

layout title date categories comments

post

Установка CUDA 9 в Windows 10 для TensorFlow и Keras

2018-02-06 11:00:00 +0500

deep_learning

true

Недавно вышла версия TensorFlow 1.5 с поддержкой CUDA 9, поэтому можно переводить TensorFlow и Keras на новую версию CUDA. В этой статье я расскажу, как установить CUDA 9 и CuDNN 7 в Windows 10. По установке для Linux будет отдельная статья.

Что нужно устанавливать

Чтобы TensorFlow и Keras могли использовать GPU под Windows, необходимо установить три компонента:

  1. Microsoft Visual Studio. Любая GPU-программа содержит код как для GPU, так и для CPU. Данные для проведения расчетов нужно загрузить из файлов и передать их в память GPU, где они будут обработаны. Результаты обработки передаются обратно на CPU для сохранения и визуализации. NVIDIA СUDA включает компилятор только для GPU. Код для CPU генерируется с помощью внешнего компилятора, для Windows это Microsoft Visual Studio.
  2. NVIDIA CUDA — библиотека, которая позволяет использовать GPU для проведения вычислений общего назначения (general purpose computing), а не только обрабатывать графику.
  3. Библиотека cuDNN. Это библиотека для CUDA, которая содержит эффективные реализации операций с нейронными сетями. В отличие от Theano, TensorFlow не может работать без cuDNN.

Проверка GPU

CUDA работает только с GPU компании NVIDIA, вот список поддерживаемых GPU. Если у вас GPU от AMD или Intel, то CUDA работать не будет и TensorFlow, к сожалению, не сможет использовать такие GPU.

Для TensorFlow нужна видеокарта с CUDA Compute Capability 3.0. Узнать Compute Capability для своей карты можно на сайте. Если у вас старый GPU с Compute Capability меньше 3.0, то вместо TensorFlow можно использовать Theano, у которой меньше требования к GPU. Однако ускорение на таких GPU будет не очень большим, по сравнению с центральным процессором.

Установка Microsoft Visual Studio

Под Windows NVIDIA CUDA использует Microsoft Visual Studio для генерации кода для CPU. Список поддерживаемых версий Visual Studio для CUDA 9 приведен на сайте NVIDIA. На момент написания этой статьи поддерживаются версии:

  • Visual Studio 2017
  • Visual Studio 2015
  • Visual Studio Community 2015
  • Visual Studio 2013
  • Visual Studio 2012

Из бесплатных версий есть только Visual Studio Community 2015, я устанавливал именно ее. Скачать Visual Studio Community 2015 можно с сайта my.visualstudio.com, нужна предварительная регистрация.

Если у вас есть Visual Studio 2017, то можно использовать ее. Однако обратите внимание, что пока не поддерживается обновленная версия Visual Studio 2017 с компилятором Visual C++ 15.5. Официально CUDA 9 работает только с Visual C++ 15.0.

Рекомендую устанавливать Visual Studio на английском языке. С русскоязычной Visual Studio есть проблемы у Theano. В TensorFlow я пока с подобными проблемами не сталкивался, но, возможно, мне просто повезло.

При установке Visual Studio выберите средства для разработки C++, остальное устанавливайте по желанию.

После установки добавьте путь к компилятору Visual С++ (cl.exe) в переменную PATH.

Установка NVIDIA CUDA

На время написания этой статьи текущей версией CUDA является 9.1. Однако TensorFlow 1.5 поддерживает только CUDA 9.0. Если установите 9.1, то получите ошибку. Странное поведение, но что поделать.

Скачать CUDA 9.0 можно на странице CUDA Toolkit Archive. Выбираем нужную версию Windows и тип загружаемого файла — exe(local). Этот файл содержит CUDA и драйвер для GPU с поддержкой CUDA. Просто скачайте файл и запустите его. Все конфигурационные параметры при установке можно оставить по умолчанию.

Установка cuDNN

cuDNN — это дополнение к NVIDIA CUDA, которое содержит эффективную реализацию операций с нейронным сетями для GPU. DNN в названии библиотеки расшифровывается как Deep Neural Networks. Некоторые библиотеки, например, Theano, могут работать с CUDA без cuDNN. Но TensorFlow так работать не может, для нее cuDNN нужна обязательно.

cuDNN можно скачать бесплатно с сайта NVIDIA. Нужна предварительная регистрация в качестве разработчика NVIDIA, что также делается бесплатно и быстро на этом же сайте.

После регистрации будет предложено скачать несколько версий cuDNN для разных версий CUDA. Выбирайте cuDNN 7 для CUDA 9.0. С другими версиями cuDNN и CUDA не будет работать TensorFlow 1.5.

cuDNN представляет собой архив, в котором всего три файла:

  • bincudnn64_7.dll
  • includecudnn.h
  • libx64cudnn.lib

Эти файлы нужно распаковать в каталог, где установлена CUDA 9.0. Как правило, это C:Program FilesNVIDIA GPU Computing ToolkitCUDAv9.0.

Перезагрузка

После установки Microsoft Visual Studio, NVIDIA CUDA и cuDNN, компьютер необходимо перезагрузить.

Проверка установки CUDA

Проверить, правильно ли установилась CUDA и видит ли она ваш GPU, можно с помощью утилиты nvidia-smi.exe. Эта утилита показывает доступные GPU для CUDA. Утилита работает в командной строке и при установке по умолчанию находится в каталоге c:Program FilesNVIDIA CorporationNVSMI. На моем ноутбуке с GPU NVIDIA GeForce GTX 1050 Ti nvidia-smi.exe выдает следующую информацию:

Tue Feb 06 13:03:37 2018
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 385.54                 Driver Version: 385.54                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name            TCC/WDDM | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 105... WDDM  | 00000000:01:00.0 Off |                  N/A |
| N/A   35C    P8    N/A /  N/A |     80MiB /  4096MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1224    C+G   ... Files (x86)DropboxClientDropbox.exe N/A      |
|    0      6080    C+G   Insufficient Permissions                   N/A      |
|    0      8440    C+G   ...351.0_x64__8wekyb3d8bbweCalculator.exe N/A      |
|    0     12664    C+G   C:Program Files (x86)SCMSCM.exe         N/A      |
|    0     14648    C+G   ...4.0_x64__8wekyb3d8bbweWinStore.App.exe N/A      |
|    0     15440    C+G   ..._8wekyb3d8bbweMessagingApplication.exe N/A      |
|    0     15880    C+G   ...osoft.LockApp_cw5n1h2txyewyLockApp.exe N/A      |
+-----------------------------------------------------------------------------+

В выводе nvidia-smi.exe видно, что в компьютере есть один GPU с номером 0, модель GeForce GTX 105… (название видеокарты поместилось не полностью), объем памяти 4 Гб, текущая загрузка 0%. В нижней части показаны процессы, которые используют GPU.

Видеокарта есть в выводе nvidia-smi.exe, это означает, что CUDA установлена успешно.

Итоги

Кратко, основные особенности установки:

  1. Обязательно нужно Microsoft Visual Studio, у меня работает бесплатная англоязычная версия Visual Studio Community 2015. Не забудьте прописать путь с компилятору Visual C++ (cl.exe) в переменную PATH, иначе CUDA его не найдет.
  2. Для TensorFlow 1.5 нужно устанавливать CUDA 9.0, а не CUDA 9.1! TensorFlow ищет файлы именно из CUDA 9.0, поэтому CUDA 9.1 не работает.
  3. Устанавливать cuDNN обязательно, т.к. без нее TensorFlow не работает. Внимательно смотрим за версиями: нужна cuDNN 7 для CUDA 9.0.

Полезные ссылки

  1. Проверка поддержки CUDA и Compute Capability.
  2. Загрузка Visual Studio Community 2015 c my.visualstudio.com.
  3. Загрузка CUDA 9.0 c CUDA Toolkit Archive
  4. Загрузка cuDNN.

Каталог статьи

      • CPU и GPU
      • 2. Что такое CUDA?
      • 3. Что такое CUDNN?
      • 4. Отношения между Куда и CUDNN
      • 5. Установка
        • 5.1 Установка CUDA
        • 5.2 Установка CUDNN
      • 6. Ссылка
      • 7. Примечание:

CPU и GPU

CPU и GPU — это разные компьютерные устройства, процессоры были распознаны людьми как компьютерное сердце, но ГПУ недавно не присоединен к людям из-за его превосходных характеристик вычисления изображений или производительности матрицы.

Отношения и разница в процессоре и гг.

img

Как видно из вышеуказанного рисункаGPU (процессор изображения, графический блок обработки графики)с участиемЦП (центральный процессор,Central Processing UnitОсновное отличие в конструкции состоит в том, что GPU имеет более эксплуатационные единицы (как зеленый алу на рисунке), а блоки управления и кэша не так много процессоров, поскольку GPU выполняет в то же время, когда GPU рассчитывается параллельно. Программа не требует слишком много контроля. Блок кэша используется для выполнения кэша данных, и CPU может уменьшить количество доступа первичную память Cache, который должен уменьшить задержку памяти.memory latency). Кэш в GPU небольшой или нет, потому что GPU может уменьшить задержки памяти параллельными вычислениями. Следовательно, конструкция CPU CAHCE в основном для достижения низких задержек, и контроль является в основном универсальным, и комплексные блоки управления логическими управляющими гарантируют, что ЦП является высокоэффективным задачами и инструкциями. Следовательно, процессор хорош в логическом контроле, который является последовательным расчетом, а GPU хорош при высокоинтенсивных расчетах, что параллельно. Например, графический процессор похоже на тысячи трудностей. Все сухие, и нет зависимости, что является независимым, простой, более мощным; ЦП похож на пакет, хотя и способен усердно работать, но есть меньше людей, поэтому Как правило, они несут ответственность за распределение задач, планирование персонала и другую работу.

Видно, что ускорение GPU реализуется параллельно через большое количество потоков, поэтому ГПУ не влияет на работу, которая не может быть очень параллельной. ЦП является последовательной операцией и требует сильной универсальности, в основном играющей роль общего управления и задачи распределения.

https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#thread-hierarchy

2. Что такое CUDA?

CUDA (вычислить единую архитектуру устройства, унифицированную вычислительную архитектуру)Это интеграционная технология, запущенная NVIDIA, которая является официальным названием компании для GPGPU. Через эту технологию пользователи могут использовать NVIDIAGeForce 8Последний GPU и новейший Quadro GPU рассчитываются. Это также первый раз, когда вы можете использовать GPU в качестве среды разработки C-компилятора. Когда NVIDIA Marketing компилятор часто смешивается с архитектурой, вызывая путаницу. На самом деле, CUDA может быть совместима с OpenCL или вашим собственным C-компилятором. Будь то CUDA C-Language или OpenCL, команда в конечном итоге будет преобразована в код PTX и будет настроен.

Другими словами, CUDA представляет собой параллельную вычислительную структуру для NVIDIA, которая находится только на GPU NVIDIA, и только тогда, когда проблема расчета, которая должна быть решена, — это сыграть много параллельно, чтобы рассчитать роль CUDA.,

Под архитектурой CUDA минимальный блок при выполнении чипа — это нить. Несколько трех могут образовывать блок. Нить в блоке может получить доступ к той же совместной совмещенной памяти и может быстро синхронизировать действие. Количество потоков, которые каждый блок может содержать, ограничено. Однако блок, который выполняет ту же программу, может образовывать сетку. Нить в другом блоке не может получить доступ к той же общую память, поэтому вы не можете напрямую общаться или синхронизировать. Следовательно, степень потока может сотрудничать в различных блоках относительно низкой. Однако, используя этот режим, вы можете позволить программе не нужно беспокоиться о количестве потоков, которые чип отображения действительно может выполняться одновременно. Например, чип отображения, имеющий очень небольшое количество блока выполнения, может выполнять последовательный порядок в каждом блоке, не одновременно. Различные сетки могут выполнять разные программы (т.е. ядро).

CUDA(ComputeUnified Device Architecture)Это операционная платформа, запущенная производителем видеокарт NVIDIA. CUDA — это общая параллельная вычислительная архитектура, запущенная NVIDIA, которая позволяет GPU решать сложные вычислительные проблемы.

3. Что такое CUDNN?

NVIDIA cuDNNЭто ускоритель GPU для глубоких нейронных сетей. Это подчеркивает производительность, простоту использования и низкую накладную расход памяти.NVIDIA cuDNNОн может быть интегрирован в более высокий уровень структуры машинного обучения, таких как Tensorflow Google, популярное программное обеспечение Caffe в Беркли, штат Калифорния. Простой плагин дизайн позволяет разработчикам сосредоточиться на проектировании и внедрении моделей нейронных сетей, а не простых регулировков, а также реализуя высокую производительность современных параллельных вычислений на графическом процессе.

4. Отношения между Куда и CUDNN

Куда считается верстанием с большим количеством инструментов, таких как молотки, отвертки и т. Д. CUDNN основан на библиотеке ускорительной библиотеки GPU в CUDA на основе CUDA, которая имеет его для завершения расчетов глубины обучения на GPU. Это эквивалентно работе, например, это гаечный ключ. Но когда куда куда нет, нет пути. Чтобы запустить глубину нейронной сети на CUDA, вы должны установить CUDNN, как вы хотите скрутить гайку. Таким образом, GPU будет работать в глубокой нейронной сети, и рабочая скорость — это много процессора.

Официальный учебник по установке
CUDA:https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html
cuDNN:https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installwindows

5. Установка

5.1 Установка CUDA

CUDA10Установочный пакет можно загрузить непосредственно с веб-сайта NVIDIA.

Согласно соответствующему варианту системы, я выбираюcuda_10.1.243_426.00_win10.exe(Размер 2,3 г), рекомендуется выбирать при установкенастроить Вместо"оптимизация"(Из английского объяснения, его можно увидеть, на самом деле, охватывание оптимизации должна быть более подходящей, она будет установлена ​​все компоненты и перезаписать существующий драйвер, но я не хочу устанавливать ведро Full-Family, пусть Один мой официальный драйвер видеокарты, чем новый).

Дважды щелкните, чтобы установить:

img

img

img

Настроить переменные среды

img

img

Проверьте, настроен ли он

5.2 Установка CUDNN

После завершения установки вам нужно скачатьСоответствующая версия, соответствующая CUDAизcuDNNПосле того, как страница загрузки, показанной ниже, после завершения загрузки поместите все файлы в этом сжатом пакете в каталог установки CUDA10 в соответствии с папкой.

img

img

img

Добавьте переменную среды

Добавить переменные среды:C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.0libx64

img

img

6. Ссылка

https://blog.csdn.net/weixin_41781408/article/details/89946085
https://blog.csdn.net/MrCharles/article/details/89193619

7. Примечание:

Невозможно построить процессор GPU с помощью AnaConda. Невозможно построить окружающую среду!

NVIDIA leads artificial intelligence computing-NVIDIA
https://www.nvidia.cn/

NVIDIA Developer-NVIDIA DEVELOPER
https://developer.nvidia.com/

NVIDIA cuDNN
https://developer.nvidia.com/cudnn

cuDNN Archive
https://developer.nvidia.com/rdp/cudnn-archive

DEEP LEARNING SDK DOCUMENTATION — cuDNN Archives
https://docs.nvidia.com/deeplearning/sdk/cudnn-archived/index.html

NVIDIA Deep Learning SDK
https://docs.nvidia.com/deeplearning/sdk/index.html

cuDNN Release 7.6.0 Documentation — cuDNN Installation Guide
https://docs.nvidia.com/deeplearning/sdk/cudnn-archived/cudnn_760/cudnn-install/index.html

1. Download cuDNN v7.6.0 (May 20, 2019), for CUDA 10.1

The NVIDIA CUDA® Deep Neural Network library (cuDNN) is a GPU-accelerated library of primitives for deep neural networks.

Library for Windows, Mac, Linux, Ubuntu and RedHat/Centos (x86_64 architecture) cuDNN Library for Windows 10

primitive ['prɪmɪtɪv]: adj. primitive, ancient, simple, rough n. primitive

Usecudnn-10.1-windows10-x64-v7.6.0.64.zip installation.

2. cuDNN Installation Guide — Overview

The NVIDIA CUDA Deep Neural Network library (cuDNN) is a GPU-accelerated library of primitives for deep neural networks. cuDNN provides highly tuned implementations for standard routines such as forward and backward convolution, pooling, normalization, and activation layers. cuDNN is part of the NVIDIA Deep Learning SDK.
NVIDIA CUDA Deep Neural Network library (cuDNN) is a GPU accelerated primitive library for deep neural networks. cuDNN provides highly optimized implementations for standard routines, such as forward and backward convolution, pooling, normalization, and activation layers. cuDNN is part of the NVIDIA Deep Learning SDK.

Deep learning researchers and framework developers worldwide rely on cuDNN for high-performance GPU acceleration. It allows them to focus on training neural networks and developing software applications rather than spending time on low-level GPU performance tuning. cuDNN accelerates widely used deep learning frameworks, including Caffe, Caffe2, TensorFlow, Theano, Torch, PyTorch, MXNet, and Microsoft Cognitive Toolkit. cuDNN is freely available to members of the NVIDIA Developer Program.
Deep learning researchers and framework developers around the world rely on cuDNN to achieve high-performance GPU acceleration. It allows them to focus on training neural networks and developing software applications without having to spend time on the underlying GPU performance tuning. cuDNN accelerates the widely used deep learning frameworks, including Caffe, Caffe2, TensorFlow, Theano, Torch, PyTorch, MXNet, and Microsoft Cognitive Toolkit. cuDNN is freely available to members of the NVIDIA Developer Program.

3. Downloading cuDNN

4. Installing cuDNN on Windows

4.1. Prerequisites

  • NVIDIA GPU
    https://developer.nvidia.com/cuda-gpus

  • Supported NVIDIA hardware, CUDA, and CUDA driver versions for cuDNN v7.5.1 — v7.6.2
    https://docs.nvidia.com/deeplearning/sdk/cudnn-support-matrix/index.html

  • One of the following supported CUDA versions and NVIDIA graphics driver:
    NVIDIA graphics driver R418 or newer for CUDA 10.1
    NVIDIA graphics driver R410 or newer for CUDA 10.0
    NVIDIA graphics driver R396 or newer for CUDA 9.2
    NVIDIA graphics driver R384 or newer for CUDA 9
    NVIDIA graphics driver R377 or newer for CUDA 8

4.1.1. Installing NVIDIA Graphics Drivers

4.1.2. Installing CUDA

4.2. Installing cuDNN on Windows

  1. cudnn-10.1-windows10-x64-v7.6.0.64.zip -> unzip to current folder
  • Your CUDA directory path is referred to as C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1

  • Your cuDNN directory path is referred to as <installpath> = E:software

  • E:softwarecuda

  1. Navigate to your <installpath> directory containing cuDNN.

  2. Unzip the cuDNN package.
    cudnn-10.1-windows10-x64-v7.6.0.64.zip

  3. Copy the following files into the CUDA Toolkit directory.
    a. Copy <installpath>cudabincudnn64_7.dll to C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1bin.
    E:softwarecudabincudnn64_7.dll -> C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1bin
    b. Copy <installpath>cudaincludecudnn.h to C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1include.
    E:softwarecudaincludecudnn.h -> C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1include
    c. Copy <installpath>cudalibx64cudnn.lib to C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1libx64.
    E:softwarecudalibx64cudnn.lib -> C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1libx64

  4. Set the following environment variables to point to where cuDNN is located. To access the value of the $(CUDA_PATH) environment variable, perform the following steps:
    a. Open a command prompt from the Start menu.
    b. Type Run and hit Enter.
    c. Issue the control sysdm.cpl command.
    d. Select the Advanced tab at the top of the window.
    e. Click Environment Variables at the bottom of the window.
    f. Ensure the following values are set:

Variable Name: CUDA_PATH 
Variable Value: C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.1

  1. Include cudnn.lib in your Visual Studio project.
    a. Open the Visual Studio project and right-click on the project name.
    b. Click Linker > Input > Additional Dependencies.
    c. Add cudnn.lib and click OK.

cuDNN v7 can coexist with previous versions of cuDNN, such as v5 or v6.

References

cuDNN Support Matrix — CUDA And NVIDIA Hardware For cuDNN
https://docs.nvidia.com/deeplearning/sdk/cudnn-support-matrix/index.html

CUDA Installation Guide for Microsoft Windows
https://docs.nvidia.com/cuda/cuda-installation-guide-microsoft-windows/index.html

Понравилась статья? Поделить с друзьями:
  • Как установить cubase 10 на windows 10
  • Как установить crysis 3 на windows 10 64 bit
  • Как установить cry of fear на windows 10
  • Как установить cortana на windows 10
  • Как установить coreldraw на windows 10 бесплатно