Jupiter notebook python как установить на windows - Доктор Windows

Jupyter Notebook is an open-source web application that allows you to create and share documents that contain live code, equations, visualizations, and narrative text. Uses include data cleaning and transformation, numerical simulation, statistical modeling, data visualization, machine learning, and much more.

Jupyter has support for over 40 different programming languages and Python is one of them. Python is a requirement (Python 3.3 or greater, or Python 2.7) for installing the Jupyter Notebook itself.

Jupyter Notebook can be installed by using either of the two ways described below:

Using Anaconda:
Install Python and Jupyter using the Anaconda Distribution, which includes Python, the Jupyter Notebook, and other commonly used packages for scientific computing and data science. To install Anaconda, go through How to install Anaconda on windows? and follow the instructions provided.
Using PIP:
Install Jupyter using the PIP package manager used to install and manage software packages/libraries written in Python. To install pip, go through How to install PIP on Windows? and follow the instructions provided.

Installing Jupyter Notebook using Anaconda:

Anaconda is an open-source software that contains Jupyter, spyder, etc that are used for large data processing, data analytics, heavy scientific computing. Anaconda works for R and python programming language. Spyder(sub-application of Anaconda) is used for python. Opencv for python will work in spyder. Package versions are managed by the package management system called conda.

To install Jupyter using Anaconda, just go through the following instructions:

Launching Jupyter:

Installing Jupyter Notebook using pip:

PIP is a package management system used to install and manage software packages/libraries written in Python. These files are stored in a large “on-line repository” termed as Python Package Index (PyPI).
pip uses PyPI as the default source for packages and their dependencies.

To install Jupyter using pip, we need to first check if pip is updated in our system. Use the following command to update pip:

python -m pip install --upgrade pip

After updating the pip version, follow the instructions provided below to install Jupyter:

Command to install Jupyter:
```
python -m pip install jupyter
```
Beginning Installation:
Downloading Files and Data:
Installing Packages:
Finished Installation:

Launching Jupyter:
Use the following command to launch Jupyter using command-line:

jupyter notebook

Источник

Все курсы > Программирование на Питоне > Занятие 14

Программа Jupyter Notebook — это локальная программа, которая открывается в браузере и позволяет интерактивно исполнять код на Питоне, записанный в последовательности ячеек.

Облачной версией Jupyter Notobook является программа Google Colab, которой мы уже давно пользуемся на курсах машинного обучения. Если вы проходили мои занятия, то в работе с этой программой для вас не будет почти ничего нового.

Способ 1. Если на вашем компьютере уже установлен Питон, то установить Jupyter Notebook можно через менеджер пакетов pip.

Способ 2 (рекомендуется). Кроме того, Jupyter Notebook входит в дистрибутив Питона под названием Anaconda.

На сегодняшнем занятии мы рассмотрим именно второй вариант установки.

Anaconda

Anaconda — это дистрибутив Питона и репозиторий пакетов, специально предназначенных для анализа данных и машинного обучения.

Основу дистрибутива Anaconda составляет система управления пакетами и окружениями conda.

Conda можно управлять двумя способами, а именно через Anaconda Prompt — программу, аналогичную командной строке Windows, или через Anaconda Navigator — понятный графический интерфейс.

Кроме того, в дистрибутив Anaconda входит несколько полезных программ:

Jupyter Notebook и JupyterLab — это программы, позволяющие исполнять код на Питоне (и, как мы увидим, на других языках) и обрабатывать данные.

Spyder и PyCharm представляют собой так называемую интегрированную среду разработки (Integrated Development Environment, IDE). IDE — это редактор кода наподобие программы Atom или Sublime Text с дополнительными возможностями автодополнения, компиляции и интерпретации, анализа ошибок, отладки (debugging), подключения к базам данных и др.

RStudio — интегрированная среда разработки для программирования на R.

На схеме структура Anaconda выглядит следующим образом:

Установка дистрибутива Anaconda на Windows

Шаг 1. Скачайте Anaconda⧉ с официального сайта.

Шаг 2. Запустите установщик.

На одном из шагов установки вам предложат поставить две галочки, в частности (1) добавить Anaconda в переменную path и (2) сделать дистрибутив Anaconda версией, которую Windows обнаруживает по умолчанию.

Не отмечайте ни один из пунктов!

Так вы сможете использовать два дистрибутива Питона, первый дистрибутив мы установили на прошлом занятии, второй — сейчас.

Как запустить Jupyter Notebook

После того как вы скачали и установили Anaconda, можно переходить к запуску ноутбука.

Шаг 1. Откройте Anaconda Navidator

Открыть Anaconda Navigator можно двумя способами.

Способ 1. Запуск из меню «Пуск». Просто перейдите в меню «Пуск» и выберите Anaconda Navigator.

Способ 2. Запуск через Anaconda Prompt. Также из меню «Пуск» откройте терминал Anaconda Prompt.

Введите команду
anaconda-navigator.

В результате должно появиться вот такое окно.

Шаг 2. Откройте Jupyter Notebook

Теперь выберите Jupyter Notebook и нажмите Launch («Запустить»).

Замечу, что Jupyter Notebook можно открыть не только из Anaconda Navigator, но и через меню «Пуск», а также введя в терминале Anaconda Prompt команду
jupyter-notebook.

В результате должен запуститься локальный сервер, и в браузере откроется перечень папок вашего компьютера.

Шаг 3. Выберите папку и создайте ноутбук

Выберите папку, в которой хотите создать ноутбук. В моем случае я выберу Рабочий стол (Desktop).

Теперь в правом верхнем углу нажмите New → Python 3.

Мы готовы писать и исполнять код точно также, как мы это делаем в Google Colab.

Импортируем библиотеку Numpy и создадим массив.

Шаг 4. Сохраните ноутбук и закройте Jupyter Notebook

Переименуйте ноутбук в mynotebook (для этого, как и в Google Colab, отредактируйте само название непосредственно в окне ноутбука). Сохранить файл можно через File → Save and Checkpoint.

Обратите внимание, помимо файла mynotebook.ipynb, Jupyter Notebook создал скрытую папку .ipynb_checkpoints. В ней хранятся файлы, которые позволяют вернуться к предыдущей сохраненной версии ноутбука (предыдущему check point). Сделать это можно, нажав File → Revert to Checkpoint и выбрав дату и время предыдущей сохраненной версии кода.

Когда вы закончили работу, закройте вкладку с ноутбуком. Остается прервать работу локального сервера, нажав Quit в правом верхнем углу.

Особенности работы

Давайте подробнее поговорим про возможности Jupyter Notebook. Снова запустим только что созданный ноутбук любым удобным способом.

Код на Python

В целом мы пишем обычный код на Питоне.

Вкладка Cell

Для управления запуском или исполнением ячеек можно использовать вкладку Cell.

Здесь мы можем, в частности:

Запускать ячейку и оставаться в ней же через Run Cells
Исполнять все ячейки в ноутбуке, выбрав Run All
Исполнять все ячейки выше (Run All Above) или ниже текущей (Run All Below)
Очистить вывод ячеек, нажав All Output → Clear

Вкладка Kernel

Командами вкладки Kernel мы управляем ядром (kernel) или вычислительным «движком» ноутбука.

В этой вкладке мы можем, в частности:

Прервать исполнение ячейки командой Interrupt. Это бывает полезно, если, например, исполнение кода занимает слишком много времени или в коде есть ошибка и исполнение кода не прервется самостоятельно.
Перезапустить kernel можно командой Restart. Кроме того, можно
- очистить вывод (Restart & Clear Output) и
- заново запустить все ячейки (Restart & Run All)

Несколько слов про то, что такое ядро и как в целом функционирует Jupyter Notebook.

Пользователь взаимодействует с ноутбуком через браузер. Браузер в свою очередь отправляет запросы на сервер. Функция сервера заключается в том, чтобы загружать ноутбук и сохранять внесенные изменения в формате JSON с расширением .ipynb. Одновременно, сервер обращается к ядру в тот момент, когда необходимо обработать код на каком-либо языке (например, на Питоне).

Такое «разделение труда» между браузером, сервером и ядром позволяет во-первых, запускать Jupyter Notebook в любой операционной системе, во-вторых, в одной программе исполнять код на нескольких языках, и в-третьих, сохранять результат в файлах одного и того же формата.

Возможность программирования на нескольких языках (а значит использование нескольких ядер) мы изучим чуть позже, а пока посмотрим как устанавливать новые пакеты для Питона внутри Jupyter Notebook.

Установка новых пакетов

Установить новые пакеты в Anaconda можно непосредственно в ячейке, введя
!pip install <package_name>. Например, попробуем установить Numpy.

Система сообщила нам, что такой пакет уже установлен. Более того, мы видим путь к папке внутри дистрибутива Anaconda, в которой Jupyter «нашел» Numpy.

При подготовке этого занятия я использовал два компьютера, поэтому имя пользователя на скриншотах указано как user или dmvma. На вашем компьютере при указании пути к файлу используйте ваше имя пользователя.

В последующих разделах мы рассмотрим дополнительные возможности по установке пакетов через Anaconda Prompt и Anaconda Navigator.

По ссылке ниже вы можете скачать код, который мы создали в Jupyter Notebook.

Два Питона на одном компьютере

Обращу ваше внимание, что на данный момент на моем компьютере (как и у вас, если вы проделали шаги прошлого занятия) установлено два Питона, один с сайта www.python.org⧉, второй — в составе дистрибутива Anaconda.

Посмотреть на установленные на компьютеры «Питоны» можно, набрав команду
where python в Anaconda Prompt.

Указав полный или абсолютный путь (absolute path) к каждому из файлов python.exe, мы можем в интерактивном режиме исполнять код на версии 3.8 (установили с www.python.org) и на версии 3.10 (установили в составе Anaconda). При запуске файла python.exe из папки WindowsApps система предложит установить Питон из Microsoft Store.

В этом смысле нужно быть аккуратным и понимать, какой именно Питон вы используете и куда устанавливаете очередной пакет.

В нашем случае мы настроили работу так, чтобы устанавливать библиотеки для Питона с www.python.org через командную строку Windows, и устанавливать пакеты в Анаконду через Anaconda Prompt.

Убедиться в этом можно, проверив версии Питона через
python —version в обеих программах.

Теперь попробуйте ввести в них команду
pip list и сравнить установленные библиотеки.

Markdown в Jupyter Notebook

Вернемся к Jupyter Notebook. Помимо ячеек с кодом, можно использовать текстовые ячейки, в которых поддерживается язык разметки Markdown. Мы уже коротко рассмотрели этот язык на прошлом занятии, когда создавали пакет на Питоне.

По большому счету, с помощью несложных команд Markdown, вы говорите Jupyter как отформатировать ту или иную часть текста.

Рассмотрим несколько основных возможностей форматирования (для удобстства и в силу практически полного совпадения два последующих раздела приведены в ноутбуке Google Colab).

Откроем ноутбук к этому занятию⧉

Заголовки

Заголовки создаются с помощью символа решетки.

# Заголовок 1

## Заголовок 2

### Заголовок 3

#### Заголовок 4

##### Заголовок 5

###### Заголовок 6

Если перед первым символом решетки поставить знак , Markdown просто выведет символы решетки.

Абзацы

Абзацы отделяются друг от друга пробелами.

Мы также можем разделять абзацы прямой линией.

Выделение текста

**Полужирный стиль**

*Курсив*

~~Перечеркнутый стиль~~

Форматирование кода и выделенные абзацы

Мы можем выделять код внутри строки или отдельным абзацем.

Отформатируем код `print(‘Hello world!’)` внутри строки и отдельным абзацем

«`

print(‘Hello world!’)

«`

Возможно выделение и текстовых абзацев ( так называемые blockquotes).

> Markdown позволяет форматировать текст без использования тэгов.

> Он был создан в 2004 году Джоном Грубером и Аароном Шварцем.

Списки

Посмотрим на создание упорядоченных и неупорядоченных списков.

**Упорядоченный список**

1. Пункт 1

1. Пункт 2 (нумерация ведется автоматически)

**Неупорядоченный список**

* Пункт 1.1

* Пункт 2.1

* Пункт 2.2

* Пункт 3.1

* Пункт 3.2

* Пункт 1.2

Ссылки и изображения

Текст ссылки заключается в квадратные скобки, сама ссылка — в круглые.

[сайт проекта Jupyter](https://jupyter.org/)

Изображение форматируется похожим образом.

![логотипы Jupyter и Python](https://www.dmitrymakarov.ru/wp-content/uploads/2022/05/jupyter-python.jpeg)

Таблицы

| id | item | price |

|— |———-| ——|

| 01 | pen | 200 |

| 02 | pencil | 150 |

| 03 | notebook | 300 |

Таблицы для Markdown бывает удобно создавать с помощью специального инструмента⧉.

Формулы на LaTeX

В текстовых полях можно вставлять формулы и математические символы с помощью системы верстки, которая называется LaTeX (произносится «латэк»). Они заключаются в одинарные или двойные символы $.

Если использовать одинарный символ $, то расположенная внутри формула останется в пределах того же абзаца. Например, запись
$ y = x^2 $ даст $ y = x^2 $.

В то время как
$$ y = x^2 $$ поместит формулу в новый абзац.

$$ y = x^2 $$

Одинарный символ добавляет пробел. Двойной символ \ переводит текст на новую строку.

$$ hat{y} = theta_0 + theta_1 x_1 + theta_2 x_2 + ... + theta_n x_n $$

$символы (пробел) и \ (перенос строки) в LaTeX$

Рассмотрим некоторые элементы синтаксиса LaTeX.

Форматирование текста

$ text{just text} $

$ textbf{bold} $

$ textit{italic} $

$ underline{undeline} $

Надстрочные и подстрочные знаки

hat $ hat{x} $

bar $ bar{x} $

vector $ vec{x} $

tilde $ tilde{x} $

superscript $ e^{ax + b} $

subscript $ A_{i, j} $

degree $ 90^{circ} $

Скобки

Вначале рассмотрим код для скобок в пределах высоты строки.

(a+b)

[a+b]

{a+b}

langle x+y rangle

|x+y|

Кроме того, с помощью
left(,
right), а также
left[,
right] и так далее можно увеличить высоту скобки. Сравните.

left(frac{1}{2}right) qquad (frac{1}{2})

Также можно использовать отдельные команды для скобок различного размера.

big( Big( bigg( Bigg(

big] Big] bigg] Bigg]

big{ Big{ bigg{ Bigg{

Дробь и квадратный корень

fraction

$$ frac{1}{1+e^{—z}} $$

square root $ sqrt{sigma^2} $

Греческие буквы

|————— |———— |————— |———— |———— |

|————— |———— |$varepsilon$ |varepsilon | ———— |

|————— |———— |$eta$ |eta | эта |

|————— |———— |$vartheta$ |vartheta | ———— |

|————— |———— |$mu$ |mu | мю |

|————— |———— |$nu$ |nu | ню |

|$Xi$ |Xi |$xi$ |xi | кси |

|$Pi$ |Pi |$pi$ |pi | пи |

|————— |———— |$varpi$ |varpi | ———— |

|————— |———— |$rho$ |rho | ро |

|————— |———— |$varrho$ |varrho | ———— |

|————— |———— |$varsigma$ |varsigma | ———— |

|————— |———— |$tau$ |tau | тау |

|$Phi$ |Phi |$phi$ |phi | фи |

|————— |———— |$varphi$ |varphi | ———— |

|————— |———— |$chi$ |chi | хи |

|$Psi$ |Psi |$psi$ |psi | пси |

Латинские обозначения

sin(—alpha) = —sin(alpha)

cos(theta)=sin left( frac{pi}{2}—theta right)

tan(x) = frac{sin(x)}{cos(x)}

log_b(1) = 0

Логические символы и символы множества

| LaTeX | symbol |

| ——————————— | ————————————— |

|Rightarrow | $ Rightarrow $ |

|rightarrow | $ rightarrow $ |

|longleftrightarrow | $ Leftrightarrow $ |

|cap | $ cap $ |

|cup | $ cup $ |

|subset | $ subset $ |

|in | $ in $ |

|notin | $ notin $ |

|varnothing | $ varnothing $ |

|neg | $ neg $ |

|forall | $ forall $ |

|exists | $ exists $ |

|mathbb{N} | $ mathbb{N} $ |

|mathbb{Z} | $ mathbb{Z} $ |

|mathbb{Q} | $ mathbb{Q} $ |

|mathbb{R} | $ mathbb{R} $ |

|mathbb{C} | $ mathbb{C} $ |

Другие символы

| LaTeX | symbol |

| ——————————— | ————————————— |

| < | $ < $ |

| leq | $ leq $ |

| > | $ geq $ |

| neq | $ neq $ |

| approx | $ approx $ |

| angle | $ angle $ |

| parallel | $ parallel $ |

| pm | $ pm $ |

| mp | $ mp $ |

| cdot | $ cdot $ |

| times | $ times $ |

| div | $ div $ |

Кусочная функция и система уравнений

Посмотрим на запись функции sgn (sign function) средствами LaTeX.

sgn(x) = left{

begin{array}

1 & mbox{if } x in mathbf{N}^*

0 & mbox{if } x = 0

—1 & mbox{else.}

end{array}

right.

Схожим образом записывается система линейных уравнений.

left{

begin{matrix}

4x + 3y = 20

—5x + 9y = 26

end{matrix}

right.

Горизонтальная фигурная скобка

overbrace{

underbrace{a}_{real} +

underbrace{b}_{imaginary} i}

^{textit{complex number}}

Предел, производная, интеграл

Пределы:

$$ lim_{x to +infty} f(x) $$

$$ lim_{x to —infty} f(x) $$

$$ lim_{x to с} f(x) $$

Производная (нотация Лагранжа):

$$ f‘(x) $$

Частная производная (нотация Лейбница):

$$ frac{partial f}{partial x} $$

Градиент:

nabla f(x_1, x_2) =

begin{bmatrix}

frac{partial f}{partial x_1} frac{partial f}{partial x_2}

end{bmatrix}

Интеграл:

$$int_{a}^b f(x)dx$$

Сумма и произведение

Сумма:

$$ sumlimits_{i=1}^n a_{i} $$

$$sum_{i=1}^n a_{i} $$

Произведение:

$$prod_{j=1}^m a_{j}$$

Матрица

Без скобок (plain):

begin{matrix}

1 & 2 & 3

a & b & c

end{matrix}

Круглые скобки (parentheses, round brackets):

begin{pmatrix}

1 & 2 & 3

a & b & c

end{pmatrix}

Квадратные скобки (square brackets):

begin{bmatrix}

1 & 2 & 3

a & b & c

end{bmatrix}

Фигурные скобки (curly brackets, braces):

begin{Bmatrix}

1 & 2 & 3

a & b & c

end{Bmatrix}

Прямые скобки (pipes):

begin{vmatrix}

1 & 2 & 3

a & b & c

end{vmatrix}

Двойные прямые скобки (double pipes):

begin{Vmatrix}

1 & 2 & 3

a & b & c

end{Vmatrix}

Программирование на R

Jupyter Notebook позволяет писать код на других языках программирования, не только на Питоне. Попробуем написать и исполнить код на R, языке, который специально разрабатывался для data science.

Вначале нам понадобится установить kernel для R. Откроем Anaconda Prompt и введем следующую команду
conda install -c r r-irkernel. В процессе установки система спросит продолжать или нет (Proceed ([y]/n)?). Нажмите y + Enter.

Откройте Jupyter Notebook. В списке файлов создайте ноутбук на R. Назовем его rprogramming.

После установки нового ядра и создания еще одного файла .ipynb схема работы нашего Jupyter Notebook немного изменилась.

Теперь мы готовы писать код на R. Мы уже начали знакомиться с этим языком, когда изучали парадигмы программирования. Сегодня мы рассмотрим основные типы данных и особенности синтаксиса.

Переменные в R

Числовые, строковые и логические переменные

Как и в Питоне, в R мы можем создавать числовые (numeric), строковые (character) и логические (logical) переменные.

# поместим число 42 в переменную numeric_var

numeric_var = 42

# строку поместим в переменную text_var

text_var <— ‘Hello world!’

# наконец присвоим значение TRUE переменной logical_var

TRUE -> logical_var

Для присвоения значений можно использовать как оператор
=, так и операторы присваивания
<— и
->. Обратите внимание, используя
-> мы можем поместить значение слева, а переменную справа.

Посмотрим на результат (в Jupyter Notebook можно обойтись без функции print()).

Выведем класс созданных нами объектов с помощью функции class().

class(numeric_var)

class(text_var)

class(logical_var)

‘numeric’

‘character’

‘logical’

Тип данных можно посмотреть с помощью функции typeof().

typeof(numeric_var)

typeof(text_var)

typeof(logical_var)

‘double’

‘character’

‘logical’

Хотя вывод этих функций очень похож, мы, тем не менее, видим, что классу numeric соответствует тип данных double (число с плавающей точкой с двумя знаками после запятой).

Числовые переменные: numeric, double, integer

По умолчанию, в R и целые числа, и дроби хранятся в формате double.

# еще раз поместим число 42 в переменную numeric_var

numeric_var <— 42

# выведем тип данных

typeof(numeric_var)

Принудительно перевести 42 в целочисленное значение можно с помощью функции as.integer().

int_var <— as.integer(numeric_var)

typeof(int_var)

Кроме того, если после числа поставить L, это число автоматически превратится в integer.

Превратить integer обратно в double можно с помощью функций as.double() и as.numeric().

typeof(as.double(int_var))

typeof(as.numeric(42L))

Если число хранится в формате строки, его можно перевести обратно в число (integer или double).

text_var <— ’42’

typeof(text_var)

typeof(as.numeric(text_var)) # можно также использовать as.double()

typeof(as.integer(text_var))

Вектор

Вектор (vector) — это одномерная структура, которая может содержать множество элементов одного типа. Вектор можно создать с помощью функции c().

# создадим вектор с информацией о продажах товара в магазине за неделю (в тыс. рублей)

sales <— c(24, 28, 32, 25, 30, 31, 29)

sales

С помощью функций length() и typeof() мы можем посмотреть соответственно общее количество элементов и тип данных каждого из них.

# посмотрим на общее количество элементов и тип данных каждого из них

length(sales)

typeof(sales)

У вектора есть индекс, который (в отличие, например, от списков в Питоне), начинается с единицы.

При указании диапазона выводятся и первый, и последний его элементы.

Отрицательный индекс убирает элементы из вектора.

Именованный вектор (named vector) создается с помощью функции names().

# создадим еще один вектор с названиями дней недели

days_vector <— c(‘Понедельник’, ‘Вторник’, ‘Среда’, ‘Четверг’, ‘Пятница’, ‘Суббота’, ‘Воскресенье’)

days_vector

‘Понедельник’ ‘Вторник’ ‘Среда’ ‘Четверг’ ‘Пятница’ ‘Суббота’ ‘Воскресенье’

# создадим именованный вектор с помощью функции names()

names(sales) <— days_vector

sales

Выводить элементы именованного вектора можно не только по числовому индексу, но и по их названиям.

Список

В отличие от вектора, список (list) может содержать множество элементов различных типов.

# список создается с помощью функции list()

list(‘DS’, ‘ML’, c(21, 24), c(TRUE, FALSE), 42.0)

[[1]]

[1] «DS»

[[2]]

[1] «ML»

[[3]]

[1] 21 24

[[4]]

[1] TRUE FALSE

[[5]]

[1] 42

Матрица

Матрица (matrix) в R — это двумерная структура, содержащая одинаковый тип данных (чаще всего числовой). Матрица создается с помощью функции matrix() с параметрами data, nrow, ncol и byrow.

data — данные для создания матрицы
nrow и ncol — количество строк и столбцов
byrow — параметр, указывающий заполнять ли элементы матрицы построчно (TRUE) или по столбцам (FALSE)

Рассмотрим несколько примеров. Cоздадим последовательность целых чисел (по сути, тоже вектор).

# для этого подойдет функция seq()

sqn <— seq(1:9)

sqn

typeof(sqn)

1 2 3 4 5 6 7 8 9

‘integer’

Используем эту последовательность для создания двух матриц.

# создадим матрицу, заполняя значения построчно

mtx <— matrix(sqn, nrow = 3, ncol = 3, byrow = TRUE)

mtx

# теперь создадим матрицу, заполняя значения по столбцам

mtx <— matrix(sqn, nrow = 3, ncol = 3, byrow = FALSE)

mtx

Зададим названия для строк и столбцов второй матрицы.

# создадим два вектора с названиями строк и столбцов

rows <— c(‘Row 1’, ‘Row 2’, ‘Row 3’)

cols <— c(‘Col 1’, ‘Col 2’, ‘Col 3’)

# используем функции rownames() и colnames(),

# чтобы передать эти названия нашей матрице

rownames(mtx) <— rows

colnames(mtx) <— cols

# посмотрим на результат

mtx

Посмотрим на размерность этой матрицы с помощью функции dim().

Массив

В отличие от матрицы, массив (array) — это многомерная структура. Создадим трехмерный массив размерностью 3 х 2 х 3. Вначале создадим три матрицы размером 3 х 2.

# создадим три матрицы размером 3 х 2,

# заполненные пятерками, шестерками и семерками

a <— matrix(5, 3, 2)

b <— matrix(6, 3, 2)

c <— matrix(7, 3, 2)

Теперь соединим их с помощью функции array(). Передадим этой функции два параметра в форме векторов: данные (data) и размерность (dim).

arr <— array(data = c(a, b, c), # вектор с матрицами

dim = c(3, 2, 3)) # вектор размерности

print(arr)

, , 1

[,1] [,2]

[1,] 5 5

[2,] 5 5

[3,] 5 5

, , 2

[,1] [,2]

[1,] 6 6

[2,] 6 6

[3,] 6 6

, , 3

[,1] [,2]

[1,] 7 7

[2,] 7 7

[3,] 7 7

Факторная переменная

Факторная переменная или фактор (factor) — специальная структура для хранения категориальных данных. Вначале немного теории.

Как мы узнаем на курсе анализа данных, категориальные данные бывают номинальными и порядковыми. Номинальные категориальные (nominal categorical) данные представлены категориями, в которых нет естественного внутреннего порядка. Например, пол или цвет волос человека, марка автомобиля могут быть отнесены к определенным категориям, но не могут быть упорядочены.

Порядковые категориальные (ordinal categorical) данные наоборот обладают внутренним, свойственным им порядком. К таким данным относятся шкала удовлетворенности потребителей, класс железнодорожного билета, должность или звание, а также любая количественная переменная, разбитая на категории (например, низкий, средний и высокий уровень зарплат).

Посмотрим, как учесть такие данные с помощью R. Начнем с номинальных данных.

# предположим, что мы собрали данные о цветах нескольких автомобилей и поместили их в вектор

color_vector <— c(‘blue’, ‘blue’, ‘white’, ‘black’, ‘yellow’, ‘white’, ‘white’)

# преобразуем этот вектор в фактор с помощью функции factor()

factor_color <— factor(color_vector)

factor_color

Как вы видите, функция factor() разбила данные на категории, при этом эти категории остались неупорядоченными. Посмотрим на класс созданного объекта.

Теперь поработаем с порядковыми данными.

# возьмем данные измерений температуры, выраженные категориями

temperature_vector <— c(‘High’, ‘Low’, ‘High’,‘Low’, ‘Medium’, ‘High’, ‘Low’)

# создадим фактор

factor_temperature <— factor(temperature_vector,

# указав параметр order = TRUE

order = TRUE,

# а также вектор упорядоченных категорий

levels = c(‘Low’, ‘Medium’, ‘High’))

# посмотрим на результат

factor_temperature

Выведем класс созданного объекта.

class(factor_temperature)

Добавлю, что количество элементов в каждой из категорий можно посмотреть с помощью функции summary().

summary(factor_temperature)

Датафрейм

Датафрейм в R выполняет примерно ту же функцию, что и в Питоне. С помощью функции data.frame() создадим простой датафрейм, гда параметрами будут названия столбцов, а аргументами — векторы их значений.

df <— data.frame(city = c(‘Москва’, ‘Париж’, ‘Лондон’),

population = c(12.7, 2.1, 8.9),

country = c(‘Россия’, ‘Франция’, ‘Великобритания’))

Доступ к элементам датафрейма можно получить по индексам строк и столбцов, которые также начинаются с единицы.

# выведем значения первой строки и первого столбца

df[1, 1]

# выведем всю первую строку

df[1,]

# выведем второй столбец

df[,2]

Получить доступ к столбцам можно и так.

Дополнительные пакеты

Как и в Питоне, в R мы можем установить дополнительные пакеты через Anaconda Prompt. Например, установим пакет ggplot2 для визуализации данных. Для этого введем команду
conda install r-ggplot2.

В целом команда установки пакетов для R следующая:
conda install r-<package_name>.

Продемонстрируем работу с этим пакетом с помощью несложного датасета mtcars.

# импортируем библиотеку datasets

library(datasets)

# загрузим датасет mtcars

data(mtcars)

# выведем его на экран

mtcars

Примечание. Здесь приведена лишь часть датасета.

Теперь импортируем установленную ранее библиотеку ggplot2.

Построим гистограмму по столбцу mpg (miles per galon, расход в милях на галлон топлива). Для построения гистограммы нам потребуется через «+» объединить две функции:

функцию ggplot(), которой мы передадим наши данные и еще одну функцию aes(), от англ. aesthetics, которая свяжет ось x нашего графика и столбец данных mpg, а также
функцию geom_histogram() с параметрами bins (количество интервалов) и binwidth (их ширина), которая и будет отвечать за создание гистограммы

# данными будет датасет mtcars, столбцом по оси x — mpg

ggplot(data = mtcars, aes(x = mpg)) +

# типом графика будет гистограмма с 10 интервалами шириной 5 миль на галлон каждый

geom_histogram(bins = 10, binwidth = 5)

Примерно также мы можем построить график плотности распределения (density plot). Только теперь мы передадим функции aes() еще один параметр
fill = as.factor(vs), который (предварительно превратив столбец в фактор через as.factor()) позволит разбить данные на две категории по столбцу vs. В этом датасете признак vs указывает на конфигурацию двигателя (расположение цилиндров), v-образное, v-shaped (vs == 0) или рядное, straight (vs == 1).

Кроме того, для непосредственного построения графика мы будем использовать новую функцию geom_density() с параметром alpha, отвечающим за прозрачность заполнения пространства под кривыми.

ggplot(data = mtcars, aes(x = mpg, fill = as.factor(vs))) +

geom_density(alpha = 0.3)

Дополнительно замечу, что к столбцам датафрейма можно применять множество различных функций, например, рассчитать среднее арифметическое или медиану с помощью несложных для запоминания mean() и median().

mean(mtcars$mpg)

median(mtcars$mpg)

Кроме того, мы можем применить уже знакомую нам функцию summary(), которая для количественного столбца выдаст минимальное и максимальное значения, первый (Q1) и третий (Q2) квартили, а также медиану и среднее значение.

Min. 1st Qu. Median Mean 3rd Qu. Max.

10.40 15.43 19.20 20.09 22.80 33.90

В файле ниже содержится созданный нами код на R.

Вернемся к основной теме занятия.

Подробнее про Anaconda

Conda

Программа conda, как уже было сказано, объединяет в себе систему управления пакетами (как pip) и, кроме того, позволяет создавать окружения.

Идея виртуального окружения (virtual environment) заключается в том, что если в рамках вашего проекта вы, например, используете определенную версию библиотеки Numpy и установка более ранней или более поздней версии приведет к сбоям в работе вашего кода, хорошим решением была бы изоляция нужной версии Numpy, а также всех остальных используемых вами библиотек. Именно для этого и нужно виртуальное окружение.

Рассмотрим, как мы можем устанавливать пакеты и создавать окружения через Anaconda Prompt и через Anaconda Navigator.

Anaconda Prompt

Про пакеты. По аналогии с pip, установленные (в текущем окружении) пакеты можно посмотреть с помощью команды
conda list.

Установить пакет можно с помощью команды
conda install <package_name>. Обновить пакет можно через
conda update <package_name>. Например, снова попробуем установить Numpy. о

Про окружения. По умолчанию мы работаем в базовом окружении (base environment). Посмотреть, какие в целом установлены окружения можно с помощью команды
conda info —envs.

Как вы видите, пока у нас есть только одно окружение. Давайте создадим еще одно виртуальное окружение и назовем его, например, waterfall.

Введите команду
conda create —name waterfall.

Введем две команды

conda activate waterfall для активации нового окружения
conda list для того, чтобы посмотреть установленные в нем пакеты

Как вы видите, в новом окружении нет ни одного пакета. Введем
conda search seaborn, чтобы посмотреть какие версии этого пакета доступны для скачивания.

Скачаем этот пакет через
conda install seaborn. Проверим установку с помощью
conda list.

Как вы видите, помимо seaborn было установлено множество других необходимых для работы пакета библиотек. Вернуться в базовое окружение можно с помощью команд
conda activate base или
conda deactivate.

Импорт модулей и переменная path

На прошлом занятии мы научились импортировать собственный модуль в командной строке Windows (cmd).

Посмотрим, отличается ли содержимое списка path для двух установленных версий Питона. Для этого в командной строке Windows и в Anaconda Prompt перейдем в интерактивный режим с помощью
python. Затем введем

Как мы видим, пути в переменной path будут отличаться и это нужно учитывать, если мы хотим локально запускать собственные модули.

Anaconda Navigator

Запускать программы, управлять окружениями и устанавливать необходимые библиотеки можно также через Anaconda Nagivator. На вкладке Home вы видите программы, которые можно открыть (launch) или установить (install) для текущего окружения.

На вкладке Environments отображаются созданные нами окружения (в частности, окружение waterfall, которое мы создали ранее) и содержащиеся в них пакеты.

В целом интерфейс интуитивно понятен, и так как мы уже познакомились с принципом создания окружений и установки в них дополнительных пакетов, уверен, работа с Anaconda Navigator сложностей не вызовет.

Прежде чем завершить, обратимся к еще одной программе для интерактивного программирования JupyterLab.

JupyterLab

JupyterLab — расширенная версия Jupyter Notebook, которая также входит в дистрибутив Anaconda. Запустить эту программу можно через Anaconda Navigator или введя команду
jupyter lab в Anaconda Prompt.

После запуска вы увидите вкладку Launcher, в которой можно создать новый ноутбук (Notebook) на Питоне или R, открыть консоль (Console) на этих языках, а также создать файлы в различных форматах (Other). Слева вы видите список папок компьютера.

В разделе Console нажмем на Python 3 (ipykernel). Введем несложный код (см. ниже) и исполним его, нажимая Shift + Enter.

Как вы видите, здесь мы можем писать код на Питоне так же, как мы это делали в командной строке Windows на прошлом занятии. Закроем консоль.

В файловой системе слева мы можем открывать уже созданные ноутбуки. Например, откроем ноутбук на R rprogramming.ipynb.

В левом меню на второй сверху вкладке мы видим открытые горизонтальные вкладки (Launcher и rprogramming.ipynb), а также запущенные ядра (kernels).

Консольные ядра (Console 1 и Console 2) можно открыть (по сути, мы снова запустим консоль).

Две оставшиеся вертикальные вкладки открывают доступ к автоматическому оглавлению (content) и расширениям (extensions).

Вкладки Run и Kernel в верхнем меню JupyterLab в целом аналогичны вкладкам Cell и Kernel в JupyterNotebook.

Подведем итог

На сегодняшнем занятии мы познакомились с программой Jupyter Notebook, а также изучили дистрибутив Anaconda, в состав которого входит эта программа.

Говоря о программе Jupyter Notebook, мы узнали про возможности работы с ячейками и ядром программы. Кроме того, мы познакомились с языком разметки Markdown и написанием формул с помощью языка верстки LaTeX.

После этого мы установили ядро для программирования на R и рассмотрели основы этого языка.

При изучении дистрибутива Anaconda мы позникомились с системой conda и попрактиковались в установке библиотек и создании окружений через Anaconda Prompt и Anaconda Navigator.

Наконец мы узнали про особенности программы JupyterLab.

Вопросы для закрепления

Вопрос. Что такое Anaconda?

Посмотреть правильный ответ

Ответ: Anaconda — это дистрибутив Питона (с репозиторием пакетов) и отдельной программой управления окружениями и пакетами conda. Пользователь может взаимодействовать с этой программой через терминал (Anaconda Prompt) и графический интерфейс (Anaconda Navigator).

Помимо этого, в дистрибутив Anaconda входят, среди прочих, программы Jupyter Notebook и JupyterLab.

Вопрос. Какой тип ячеек доступен в Jupyter Notebook?

Посмотреть правильный ответ

Ответ: в Jupyter Notebook есть два основных типа ячеек — ячейки для написания кода (в частности, на Питоне и R) и текстовые ячейки, поддерживающие Markdown и LaTeX.

Вопрос. Для чего нужно виртуальное окружение?

Посмотреть правильный ответ

Ответ: виртуальное окружение (virtual environment) позволяет установить и изолировать определенные версии Питона и его пакетов. Таким образом код, написанный с учетом конкретной версии Питона и дополнительных библиотек, исполнится без ошибок.

Ответы на вопросы

Вопрос. Можно ли исполнить код на R в Google Colab?

Ответ. Да, это возможно. Причем двумя способами.

Способ 1. Откройте ноутбук. Введите и исполните команду
%load_ext rpy2.ipython. В последующих ячейках введите
%R, чтобы в этой же строке написать код на R или
%%R, если хотите, чтобы вся ячейка исполнилась как код на R (так называемые магические команды).

В этом случае мы можем исполнять код на двух языках внутри одного ноутбука.

# введем магическую команду, которая позволит программировать на R

%load_ext rpy2.ipython

# команда %%R позволит Colab распознать ячейку как код на R

%%R

# кстати, числовой вектор можно создать просто с помощью двоеточия

x <— 1:10

# при этом ничто не мешает нам продолжать писать код на Питоне

import numpy as np

np.mean([1, 2, 3])

Приведенный выше код можно найти в дополнительных материалах⧉ к занятию.

Способ 2. Если вы хотите, чтобы весь код исполнялся на R (как мы это делали в Jupyter Notebook), создайте новый ноутбук используя одну из ссылок ниже:

https://colab.research.google.com/#create=true&language=r⧉
https://colab.to/r⧉

Теперь, если вы зайдете на вкладку Runtime → Change runtime type, то увидите, что можете выбирать между Python и R.

Выведем версию R в Google Colab.

‘R version 4.2.0 (2022-04-22)’

Посмотреть на установленные пакеты можно с помощью
installed.packages(). Созданный ноутбук Google Colab на R доступен по ссылке⧉.

Вопрос. Очень медленно загружается Anaconda. Можно ли что-то сделать?

Ответ. Можно работать через Anaconda Prompt, эта программа быстрее графического интерфейса Anaconda Navigator.

Кроме того, можно использовать дистрибутив Miniconda⧉, в который входит conda, Питон и несколько ключевых пакетов. Остальные пакеты устанавливаются вручную по мере необходимости.

Вопрос. Разве Jupyter не должен писаться через i, как Jupiter?

Ответ. Вы правы в том плане, что название Jupyter Notebook происходит не от планеты Юпитер, которая по-английски как раз пишется через i (Jupiter), а представляет собой акроним от названий языков программирования Julia, Python и R.

При этом, как утверждают разработчики⧉, слово Jupyter также отсылает к тетрадям (notebooks) Галилея, в которых он, в частности, документировал наблюдение за лунами Юпитера.

Вопрос. В каких еще программах можно писать код на Питоне и R?

Ответ. Таких программ несколько. Довольно удобно пользоваться облачным решением Kaggle. Там можно создавать как скрипты (scripts, в том числе RMarkdown Scripts), так и ноутбуки на Питоне и R. Подробнее можно почитать в документации⧉ на их сайте.

Вопрос. Можно ли создать виртуальное окружение каким-либо другим способом помимо программы conda?

Ответ. Да, можно. Вот здесь⧉ есть хорошая видео-инструкция.

Вот коротко какие шаги нужно выполнить.

Вначале убедитесь, что у вас уже установлен Питон. В нем по умолчанию содержится модуль venv, который как раз предназначен для создания виртуального окружения.

Шаг 1. Создайте папку с вашим проектом, например, пусть это будет папка webapp для веб-приложения на популярном фреймворке для Питона Django.

Шаг 2. В командной строке перейдите в папку webapp.

Затем введите команду для создания виртуального окружения.

По сути мы говорим Питону создать окружение djenv (название может быть любым) с помощью модуля venv. Переключатель (flag или switch)
-m подсказывает питону, что venv — это модуль, а не файл.

После выполнения этой команды создается папка djenv виртуального окружения.

Шаг 3. Активируем это виртуальное окружение следующей командой.

Здесь мы обращаемся к файлу activate внутри папки Scripts. Как вы видите, название окружения появилось слева от пути к папке.

Теперь через pip можно устанавливать пакеты, которые будут «видны» только внутри виртуального окружения djenv.

Шаг 4. Выйти из этого виртуального окружения можно с помощью команды deactivate. Если вам нужно удалить окружение, сначала деактивируйте его, а затем вручную удалите соответствующую папку.

На следующем занятии мы поговорим про такую важную тему, как регулярные выражения.

Источник

Contents

Prerequisite: Python
Installing Jupyter using Anaconda and conda
Alternative for experienced Python users: Installing Jupyter with pip

This information explains how to install the Jupyter Notebook and the IPython
kernel.

Prerequisite: Python¶

While Jupyter runs code in many programming languages, Python is
a requirement (Python 3.3 or greater, or Python 2.7) for installing
the Jupyter Notebook.

We recommend using the Anaconda
distribution to install Python and Jupyter. We’ll go through its installation
in the next section.

Installing Jupyter using Anaconda and conda¶

For new users, we highly recommend installing Anaconda. Anaconda conveniently
installs Python, the Jupyter Notebook, and other commonly used packages for
scientific computing and data science.

Use the following installation steps:

Download Anaconda. We recommend
downloading Anaconda’s latest Python 3 version (currently Python 3.5).
Install the version of Anaconda which you downloaded, following the
instructions on the download page.
Congratulations, you have installed Jupyter Notebook. To run the notebook:

See Running the Notebook for more details.

Alternative for experienced Python users: Installing Jupyter with pip¶

Important

Jupyter installation requires Python 3.3 or greater, or
Python 2.7. IPython 1.x, which included the parts that later became Jupyter,
was the last version to support Python 3.2 and 2.6.

As an existing Python user, you may wish to install Jupyter using Python’s
package manager, pip, instead of Anaconda.

First, ensure that you have the latest pip;
older versions may have trouble with some dependencies:

pip3 install --upgrade pip

Then install the Jupyter Notebook using:

(Use pip if using legacy Python 2.)

Congratulations. You have installed Jupyter Notebook. See
Running the Notebook for more details.

Источник

24 марта, 2017 12:00 пп
34 842 views
| Комментариев нет

Python

Jupyter Notebook предлагает командную оболочку для интерактивных вычислений. Приложение Jupyter Notebook может взаимодействовать со многими языками программирования (Python, Julia, R, Haskell и Ruby) и часто используется для работы с данными, статистического моделирования и машинного обучения.

Jupyter позволяет создавать документы, объединяющие код и текст (абзацы, уравнения, цифры, ссылки и т.д.), которые помогают в представлении воспроизводимых исследований.

Данное руководство поможет установить Jupyter Notebook локально или на виртуальный сервер Ubuntu 16.04, а также ознакомит вас с основами работы данного приложения. В результате вы сможете запустить код Python 3 с помощью Jupyter Notebook на локальной машине или удалённом сервере.

Требования

Среда разработки Python 3 на локальной машине (инструкции по настройке локальной среды ищите здесь) или удалённом сервере Ubuntu 16.04.
Пользователь с доступом sudo; все команды данного руководства нужно запускать в сессии этого пользователя. Больше информации вы найдёте здесь.

1: Установка Jupyter Notebook

Jupyter Notebook можно установить с помощью пакетного менеджера pip.

Разверните среду разработки Python 3, в которую вы хотите установить Jupyter Notebook (в данном руководстве среда условно называется my_env).

cd ~/environments . my_env/bin/activate

Затем нужно обновить pip:

pip install --upgrade pip

Чтобы установить Jupyter Notebook, запустите:

pip install jupyter

Приложение Jupyter Notebook установлено и готово к работе.

2: Подключение к серверу через SSH-туннель (опционально)

Если вы установили Jupyter Notebook на удалённый сервер, вам нужно подключиться к веб-интерфейсу с помощью SSH-туннеля. Jupyter Notebook использует конкретный порт (:8888, :8889), а SSH-туннель позволит защитить данные, передаваемые на этот порт сервера.

SSH-туннелирование в Mac или Linux

Если вы работаете с системами Mac или Linux, вы можете создать SSH-туннель, выполнив следующую команду SSH в новом локальном окне терминала:

ssh -L 8888:localhost:8888 your_server_username@your_server_ip

Команда ssh создает SSH-подключение, а флаг –L перенаправляет данный порт локального (клиентского) хоста на хост и порт на удаленной (серверной) стороне. То есть всё, что работает на этом порте на серверной стороне, будет передаваться на тот же порт на локальной машине.

Примечание: При необходимости укажите другой номер порта вместо 8888. Вместо server_username укажите имя текущего пользователя (например, 8host), а вместо your_server_ip – IP-адрес сервера. Например:

ssh -L 8888:localhost:8888 8host@203.0.113.0

Если команда не вернула ошибок, вернитесь в среду разработки и запустите Jupyter Notebook:

jupyter notebook

В выводе команды вы найдёте URL. Откройте в браузере на локальной машине ссылку:

http://localhost:8888

По запросу предоставьте токен.

SSH-туннелирование в Windows и Putty

Если вы используете Windows, вы можете создать SSH-туннель с помощью Putty.

Читайте также: Создание SSH-ключей для подключения к VPS с помощью PuTTY

В поле Host Name (or IP address) укажите IP-адрес сервера, в Port укажите порт 22, в поле Saved Session укажите сессию удалённого сервера. В Connection type выберите SSH и нажмите Tunnels. Введите номер локального порта для доступа к Jupyter (выберите 8000 или выше, чтобы избежать конфликтов с другими приложениями). Укажите направление localhost:8888, где :8888 – номер порта, который использует Jupyter Notebook.

Нажмите Add, после чего порты появятся в списке Forwarded ports.

Нажмите Open, чтобы подключиться к серверу по SSH и создать туннель между указанными портами.

Откройте в браузере ссылку http://localhost:8000 (если вы указали другой номер порта, откорректируйте его), чтобы подключиться к Jupyter Notebook.

По запросу предоставьте токен.

3: Запуск Jupyter Notebook

Теперь можно запустить приложение Jupyter Notebook в терминале.

jupyter notebook

В терминале появится лог Jupyter Notebook. Как правило, при первом запуске Jupyter Notebook использует порт 8888. Чтобы узнать, какой порт использует приложение, ознакомьтесь с выводом предыдущей команды:

[I NotebookApp] Serving notebooks from local directory: /home/8host [I NotebookApp] 0 active kernels [I NotebookApp] The Jupyter Notebook is running at: http://localhost:8888/ [I NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation). ...

Если вы работаете с Jupyter Notebook на локальной машине, веб-приложение Jupyter Notebook откроется в браузере по умолчанию. Если этого не произошло (или вы случайно закрыли окно), найдите в логе URL или откройте localhost:8888, чтобы подключиться.

Чтобы остановить приложение Jupyter Notebook, нажмите CTRL+C, затем Y и Enter для подтверждения.

Вы получите следующий вывод:

[C 12:32:23.792 NotebookApp] Shutdown confirmed [I 12:32:23.794 NotebookApp] Shutting down kernels

Приложение Jupyter Notebook остановлено.

4: Использование Jupyter Notebook

Данный раздел охватывает основы работы с Jupyter Notebook.

Примечание: Если вы ещё не запустили приложение, сделайте это с помощью команды:

jupyter notebook

Вы должны подключиться к приложению Jupyter Notebook в браузере.

Jupyter Notebook – очень производительное приложение с большим количеством полезных функций.

Чтобы создать документ, выберите в выпадающем меню справа New → Python 3 в правом верхнем выпадающем меню.

Это откроет новый документ. Теперь можно запустить код Python в ячейке или настроить markdown. Настройте первую ячейку для поддержки markdown; для этого нажмите Cell → Cell Type → Markdown в верхнем меню. Теперь можно использовать Markdown для создания записей и даже добавлять уравнения, написанные в LaTeX, помещая их между символами $$. Для примера введите следующую команду в ячейку после настройки markdown:

# Simple Equation Let us now implement the following equation: $$ y = x^2$$ where $x = 2$

Чтобы превратить Markdown в форматированный текст, нажмите клавиши Ctrl + Enter, и вы получите:

Simple Equation Let us now implement the following equation in Pyton: y=x² and print the result where x = 2

Вы можете использовать ячейки markdown для записей и создания кода. Попробуйте решить простое уравнение и получить результат на экране. Кликните по верхней ячейке, нажмите Alt+Enter, чтобы добавить новую ячейку ниже, и введите в неё следующий код:

x = 2 y = x**2 print(y)

Чтобы запустить код, нажмите Ctrl+Enter. Вы получите такой результат:

Simple Equation Let us now implement the following equation in Pyton: y=x² and print the result where x = 2 In [2]: x = 2 y = x*x print (y) 4

Заключение

Теперь вы можете использовать Jupyter, чтобы писать воспроизводимый код Python и заметки в markdown. Чтобы получить быструю справку по Jupyter Notebook, выберите Help → User Interface Tour в верхнем меню навигации.

Tags: Jupyter Notebook, Linux, Mac OS, ML, Python 3, SSH, Windows, Машинное обучение

Источник

In this article, We will cover how to install Jupyter Notebook without Anaconda on Windows. Before the installation procedure let us try to understand what is Jupyter Notebook?

Jupyter Notebook

Jupyter Notebook is a free, open-source, and interactive web application that allows us to create and share documents containing live code, equations, visualizations, and narrative text. Some of the most important uses of Jupyter Notebook are data cleaning and transformation, numerical simulation, statistical modeling, data visualization, machine learning, and much more interesting.

Jupyter Notebook provides support for over 40 different programming languages. And the interesting thing is Python is one of them. To install the Jupyter Notebook in order to work with python needs the version of Python as follows: (Python 3.3 or greater, or Python 2.7).

Now as we are not installing Jupyter Notebook through Anaconda, but we install it with the help of PIP. Now there must be a question in your mind what is PIP?

So let us direct our discussion to PIP

What is PIP?

In Python, the package installer is known as PIP. PIP is basically a package management system that is mainly used to install and manage software packages/libraries that are written in Python.

And all the files are mainly stored in a large «on-line repository» which is termed as Python Package Index that is PyPI.
Thus the pip uses PyPI as its default source for the packages and their dependencies.

To install the Jupyter Notebook in your system, first of all, you need to check if PIP is already installed or not. You will need to write the command in your command prompt.The command to update the pip is as given below:

python -m pip install --upgrade pip

Then you will see this on your screen:

After the updation of pip, the steps to install Jupyter Notebook are as follows:

1. To Install the Jupyter, the command is as given below:

python -m pip install jupyter

2. After the installation begins you will see this:

3. Installation of Packages and finish of Installation

Launching the Jupyter in command prompt

To launch the Jupyter you need to write the following command

jupyter notebook

After writing the above command in your cmd, you will see this:

And then it will open this:

Now To create a Notebook where you will store and run your code you just need to make a click on «New» on the top on the right side; there you have four options: Python 3(notebook), Text File, Folder, and Terminal. Just click on Python 3 and start your coding.

The notebook is always saved with (.ipynb) extension.

Now we will show you what exactly you will see on your screen:

Hopefully, you guys understood the installation of Jupyter without the help of Anaconda. For any doubts or queries, please comment below.

Требования

Нам понадобится среда программирования для Python 3, установленная либо на локальной машине, либо на сервере Ubuntu 16.04.

Jupyter Notebook можно установить при помощи пакетного менеджера pip.

В статье будет использоваться виртуальное окружение с именем my_env. Для установки пакета для работы с виртуальным окружением введите следующую команду в терминале:

$ sudo apt-get install -y python3-venv

Теперь мы готовы создать виртуальное окружение. Выбираем каталог, в который все будет установлено, или создаем новый каталог с mkdir:

$ mkdir environments
$ cd environments

Как только вы переместитесь в нужную вам директорию, введите следующую команду в терминал:

$ pyvenv my_env

По сути, pyvenv создает новый каталог, содержащий несколько элементов, которые мы можем просмотреть с помощью команды ls:

$ ls my_env

Output
bin include lib lib64 pyvenv.cfg share

Для активации виртуального окружения вам осталось ввести последнюю команду:

$ source my_env/bin/activate

Затем нужно убедиться, что pip был обновлен до последней версии:

(my_env) sammy@ubuntu: pip3 install --upgrade pip

Теперь можно установить Jupyter Notebook следующей командой:

(my_env) sammy@ubuntu: pip3 install jupyter

После этой строчки кода Jupyter Notebook будет установлен в активное виртуальное окружение.

Следующий шаг предназначен для тех, кто хочет подключиться к веб-интерфейсу, используя SSH-туннелирование.

Шаг 2 (необязательный). Запуск Jupiter Notebook на сервере

Для тех, кто установил Jupyter Notebook на удаленный сервер, нужно подключаться к веб-интерфейсу через SSH-туннель. Приложение использует порт 8888 (или же 8889), а SSH-туннель поможет обезопасить соединение с сервером.

SSH-туннелирование с помощью Mac или Linux

Для тех, кто работает с macOS или Linux, нужно выполнить следующую команду в окне терминала:

$ ssh -L 8888:localhost:8888 your_server_username@your_server_ip

Команда ssh создаст SSH-подключение, а флаг –L перенаправит порт локального или клиентского хоста на хост и порт уделенного сервера. То есть все, что работает на порте 8888 с серверной стороны, будет работать на порте 8888 вашей локальной машины.

При необходимости можно изменить порт 8888 на один из ваших вариантов, чтобы избежать использования порта, который уже используется другим процессом:

server_username — имя пользователя на сервере (например, sammy);
your_server_ip — это IP-адрес сервера.

Например, для имени пользователя sammy и адреса сервера 203.0.113.0 команда будет следующей:

$ ssh -L 8888:localhost:8888 sammy@203.0.113.0

Если после запуска команды ssh -L не появляется ошибка, можно переходить в среду программирования и запустить Jupyter Notebook:

(my_env) sammy@ubuntu: jupyter notebook

После этого, вы получите результат содержащий URL-адрес. Введите его в окне браузера и перейдите к веб-интерфейсу Jupyter Notebook (http://localhost:8888).

SSH-туннелирование с помощью Windows и Putty

Пользователи Windows могут создать туннель SSH, используя программу Putty.

Сначала нужно ввести URL-адрес сервера или IP-адрес имени хоста, как показано ниже на скриншоте:

Далее нажимаем SSH внизу левой панели, для раскрытия полного меню и нажимаем на слово Tunnels (туннели). Вводим номер локального порта, который будет использоваться для доступа к Jupyter на локальном компьютере. Выбираем порт 8000 или выше, чтобы избежать совпадения портов, используемых другими службами, и указываем назначение как localhost: 8888, где: 8888 — это номер порта, через который работает Jupyter Notebook.

Теперь нажмите кнопку Add (добавить), и порты должны появиться в списке Forwarded ports (Переадресованные порты):

И после этого переходим по адресу http://localhost:8000 (или любым другим портом, который вы выбрали) в веб-браузере, чтобы подключиться к Jupyter Notebook, работающему на сервере.

Шаг 3. Запуск Jupyter Notebook локально

После окончания установки Jupyter Notebook можно запустить при помощи следующей команды в терминале:

(my_env) sammy@ubuntu: jupyter notebook

В терминале выведутся логи Jupyter Notebook. При запуске инструмент использует определенный порт. Обычно это 8888. Для проверки порта, с которым работает Jupyter Notebook, используйте команду, при помощи которой запускался Jupyter Notebook:

Output
[I NotebookApp] Serving notebooks from local directory: /home/sammy
[I NotebookApp] 0 active kernels 
[I NotebookApp] The Jupyter Notebook is running at: http://localhost:8888/
[I NotebookApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).
...

Если вы используете Jupyter Notebook на локальном компьютере, а не на сервере, то при открытии веб-приложения Jupyter Notebook должен открыться ваш браузер по умолчанию. Если этого не произошло, можно открыть браузер вручную и перейти к http://localhost: 8888 для подключения.

Если нужно остановить процессы Jupyter Notebook, то нажмите CTRL + C, а потом Y при появлении запроса на закрытие и ENTER для подтверждения.

Вы получите следующий результат:

Output
[C 12:32:23.792 NotebookApp] Shutdown confirmed
[I 12:32:23.794 NotebookApp] Shutting down kernels

Jupyter Notebook остановлен.

Шаг 4. Использование Jupyter Notebook

Пришло время начать использование Jupyter Notebook.

Теперь можно подключиться к нему с помощью веб-браузера. Jupyter Notebook — очень мощный инструмент и имеет множество функций. В этом разделе описываются некоторые основные функции, позволяющие начать работу с ним. Jupyter Notebook покажет все файлы и папки в каталоге, из которого он запущен, поэтому, когда начинается работа над проектом, обязательно нужно запускать его из каталога проекта.

Чтобы создать документ выбираем New → Python 3 в верхнем выпадающем меню:

После открытия документа можно запускать код Python в ячейке или использовать язык разметки Markdown. Чтобы изменить первую ячейку для работы с Markdown, нужно нажать в верхней панели навигации Cell → Cell Type → Markdown. Теперь можно создавать заметки с использованием Markdown и даже включать уравнения, написанные в LaTeX, помещая их между символами $$. Например, попробуем ввести следующую команду в ячейку после включения Markdown:

# Simple Equation

Let us now implement the following equation:
$$ y = x^2$$

where $x = 2$

Чтобы переформатировать Markdown в форматированный текст, нажимаем CTRL + ENTER и получаем следующие результаты:

Также можно использовать ячейки Markdown для написания кода. Для теста напишем небольшое уравнение и выведем результат. Нажимаем на верхнюю ячейку, нажимаем ALT+ENTER для создания ячейки под ней и вводим следующий код в новую ячейку:

x = 2
y = x**2
print(y)

Чтобы запустить код, нажимаем CTRL + ENTER и получаем следующие результаты:

Теперь у вас есть возможность импортировать модули и использовать Jupyter Notebook так же, как и в любой другой среде разработки Python!

Вывод

Поздравляем! Теперь вы можете написать воспроизводимый код Python и заметки в Markdown с помощью Jupyter Notebook. Для получения справки по использованию Jupyter Notebook нажмите Help → User Interface Tour в главном меню навигации.

Перевод статьи «How To Set Up Jupyter Notebook for Python 3»

Источник

How to: Как установить Jupyter Notebook.

Introduction

Jupyter Notebook — это веб-приложение с открытым исходным кодом, позволяющее создавать документы, содержащие интерактивный код, уравнения, визуализации, текст и обмениваться ими. Используется для очистки и преобразования данных, численного моделирования, статистического моделирования, визуализации данных, машинного обучения и многого другого.

Requirements

Операционная система: Windows, Mac, Linux.

Python 3.3 или выше.

Installation

Для начала нам нужен Python.

Идем на сайт https://www.python.org/downloads/ и скачиваем последнюю версию для своей операционной системы.

Далее на примере Windows 10 pro запускаем установочный файл и перезапускаем компьютер.

Теперь нам надо убедиться, что у вас установлен python версии 3.3 и выше. На Mac и во многих дистрибутивах Linux python уже установлен по умолчанию. В Windows же его нужно устанавливать дополнительно.

Для этого открываем командную строку или cmd.

Вводим тескт python и нажимаем Enter.

Теперь, надо запустить Jupyter Notebook.

Для этого мы переоткрываем командную строку, и вводим python -m pip install jupyter и нажимаем Enter.
После этого начнется загрузка jupyter notebook.

Начало работы

Для начала работы, опять перезаходим в командную строку, печатаем jupyter-notebook и нажимаем Enter.

Это запустит сервер, а браузер откроет новую вкладку со следующим URL: https://localhost:8888/tree

В этой вкладке мы и будем работать. Вкладка cmd должна быть открыта на протяжении всей вашей работы с Jupyter Notebook.

Источник

Installing Jupyter Notebook using Anaconda:

Installing Jupyter Notebook using pip:

Anaconda

Установка дистрибутива Anaconda на Windows

Как запустить Jupyter Notebook

Шаг 1. Откройте Anaconda Navidator

Шаг 2. Откройте Jupyter Notebook

Шаг 3. Выберите папку и создайте ноутбук

Шаг 4. Сохраните ноутбук и закройте Jupyter Notebook

Особенности работы

Код на Python

Вкладка Cell

Вкладка Kernel

Установка новых пакетов

Два Питона на одном компьютере

Markdown в Jupyter Notebook

Заголовки

Абзацы

Выделение текста

Форматирование кода и выделенные абзацы

Списки

Ссылки и изображения

Таблицы

Формулы на LaTeX

Форматирование текста

Надстрочные и подстрочные знаки

Скобки

Дробь и квадратный корень

Греческие буквы

Латинские обозначения

Логические символы и символы множества

Другие символы

Кусочная функция и система уравнений

Горизонтальная фигурная скобка

Предел, производная, интеграл

Сумма и произведение

Матрица

Программирование на R

Переменные в R

Числовые, строковые и логические переменные

Числовые переменные: numeric, double, integer

Вектор

Список

Матрица

Массив

Факторная переменная

Датафрейм

Дополнительные пакеты

Подробнее про Anaconda

Conda

Anaconda Prompt

Импорт модулей и переменная path

Anaconda Navigator

JupyterLab

Подведем итог

Вопросы для закрепления

Ответы на вопросы

Prerequisite: Python¶

Installing Jupyter using Anaconda and conda¶

Alternative for experienced Python users: Installing Jupyter with pip¶

Требования

1: Установка Jupyter Notebook

2: Подключение к серверу через SSH-туннель (опционально)

SSH-туннелирование в Mac или Linux

SSH-туннелирование в Windows и Putty

3: Запуск Jupyter Notebook

4: Использование Jupyter Notebook

Заключение

Jupyter Notebook

What is PIP?

Launching the Jupyter in command prompt

You may also like:

Требования

Шаг 2 (необязательный). Запуск Jupiter Notebook на сервере

SSH-туннелирование с помощью Mac или Linux

SSH-туннелирование с помощью Windows и Putty

Шаг 3. Запуск Jupyter Notebook локально

Шаг 4. Использование Jupyter Notebook

Вывод

How to: Как установить Jupyter Notebook.