from datetime import datetime, date, time, timezone
import pandas as pd
import requests

def yahoo_url(ticker: str, from_day: str, to_day: str) -> str:
    """Return url to request yahoo finance."""
    from_dt = int(
        datetime.combine(
            date.fromisoformat(from_day), time(), tzinfo=timezone.utc)
            .timestamp()
    )
    to_dt = int(
        datetime.combine(
            date.fromisoformat(to_day), time(), tzinfo=timezone.utc)
            .timestamp()
    )
    return (
        "https://query1.finance.yahoo.com/v7/finance/download/"
        f"{ticker.upper()}"
        f"?period1={from_dt}&period2={to_dt}&interval=1d"
        "&events=history&includeAdjustedClose=true"
    )


                                        
                                            def yahoo_to_series(ticker: str, from_day: str, to_day: str) -> pd.Series:
    """Return closing prices for ticker from Yahoo finance."""
    def to_float(str):
        if str == 'null':
            return None
        else:
            return float(str)
    url = yahoo_url(ticker, from_day, to_day)
    r = requests.get(url)
    content = r.content.decode('utf-8')
    try:
        d = {s.split(',')[0]: to_float(s.split(',')[4])
            for s in content.split('\n')[1:]}
        print(f'Dowloaded closing prices for {ticker}')
    except IndexError:
        print(f'Request returned {r}\ncould not parse {ticker}')
        return None
    ser = pd.Series(data=d,
                    name=ticker.upper(),
                    dtype='float32')
    ser.index = pd.to_datetime(ser.index)
    ser.index.name = 'date'
    return ser


                                        
                                            tickers = ['ETH-USD', 'BTC-USD', 'XLM-USD',
        'XRP-USD', 'ADA-USD', 'LINK-USD']
from_day = '2020-05-01'
to_day = '2021-05-01'

series = [yahoo_to_series(ticker, from_day, to_day) for ticker in tickers]

Dowloaded closing prices for ETH-USD
Dowloaded closing prices for BTC-USD
Dowloaded closing prices for XLM-USD
Dowloaded closing prices for XRP-USD
Dowloaded closing prices for ADA-USD
Dowloaded closing prices for LINK-USD


                                        
                                            prices = pd.concat(series, axis=1, join='outer')
prices.dropna(axis=0, how='all', inplace=True)
prices.head()


                                        
                                            import numpy as np
from sklearn.preprocessing import MinMaxScaler

X = prices.iloc[:-1, ].values.astype(np.float64)
y = prices.iloc[1:, :].values.astype(np.float64)

n_train = int(len(prices) * 0.8)
X_train, y_train = X[:n_train, :], y[:n_train, :]
X_test, y_test = X[n_train:, :], y[n_train:, :]

sc = MinMaxScaler(feature_range=(0, 1))
X_train_scaled = sc.fit_transform(X_train)
y_train_scaled = sc.fit_transform(y_train)
X_test_scaled = sc.fit_transform(X_test)
y_test_scaled = sc.fit_transform(y_test)

X_train_scaled = X_train_scaled.reshape((1,) + X_train_scaled.shape)
y_train_scaled = y_train_scaled.reshape((1,) + y_train_scaled.shape)
X_test_scaled = X_test_scaled.reshape((1,) + X_test_scaled.shape)
y_test_scaled = y_test_scaled.reshape((1,) + y_test_scaled.shape)

print(X_train_scaled.shape)

(1, 290, 6)


                                        
                                            inputs = keras.layers.Input(shape=(None, len(tickers)))
conv_1 = keras.layers.Conv1D(
    20, kernel_size=2, padding='causal',
    activation='relu', name='conv_1',
)(inputs)
conv_2 = keras.layers.Conv1D(
    20, kernel_size=2, padding='causal',
    activation='relu', dilation_rate=2, name='conv_2'
)(conv_1)
conv_3 = keras.layers.Conv1D(
    20, kernel_size=2, padding='causal',
    activation='relu', dilation_rate=4, name='conv_3'
)(conv_2)
conv_4 = keras.layers.Conv1D(
    20, kernel_size=2, padding='causal',
    activation='relu', dilation_rate=8, name='conv_4'
)(conv_3)
outputs = keras.layers.Conv1D(
    len(tickers), kernel_size=1,
    name='output'
)(conv_4)

model = keras.models.Model(inputs=inputs, outputs=outputs)
model.summary()

Model: "model_3"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
input_4 (InputLayer)         [(None, None, 6)]         0         
_________________________________________________________________
conv_1 (Conv1D)              (None, None, 20)          260       
_________________________________________________________________
conv_2 (Conv1D)              (None, None, 20)          820       
_________________________________________________________________
conv_3 (Conv1D)              (None, None, 20)          820       
_________________________________________________________________
conv_4 (Conv1D)              (None, None, 20)          820       
_________________________________________________________________
output (Conv1D)              (None, None, 6)           126       
=================================================================
Total params: 2,846
Trainable params: 2,846
Non-trainable params: 0
_________________________________________________________________


                                        
                                            optimizer = keras.optimizers.Adam()

loss = keras.losses.MeanAbsoluteError()

model.compile(optimizer=optimizer, loss=loss)

model.fit(X_train_scaled, y_train_scaled, epochs=200, batch_size=1,
        validation_data=(X_test_scaled, y_test_scaled))

Epoch 1/200
1/1 [==============================] - 1s 570ms/step - loss: 0.1569 - val_loss: 0.3113
Epoch 2/200
1/1 [==============================] - 0s 32ms/step - loss: 0.1487 - val_loss: 0.2994
Epoch 3/200
1/1 [==============================] - 0s 30ms/step - loss: 0.1413 - val_loss: 0.2894
Epoch 4/200
1/1 [==============================] - 0s 31ms/step - loss: 0.1346 - val_loss: 0.2812
Epoch 5/200
1/1 [==============================] - 0s 29ms/step - loss: 0.1285 - val_loss: 0.2744
...
Epoch 195/200
1/1 [==============================] - 0s 32ms/step - loss: 0.0240 - val_loss: 0.1797
Epoch 196/200
1/1 [==============================] - 0s 33ms/step - loss: 0.0237 - val_loss: 0.1797
Epoch 197/200
1/1 [==============================] - 0s 32ms/step - loss: 0.0238 - val_loss: 0.1789
Epoch 198/200
1/1 [==============================] - 0s 31ms/step - loss: 0.0235 - val_loss: 0.1792
Epoch 199/200
1/1 [==============================] - 0s 32ms/step - loss: 0.0235 - val_loss: 0.1790
Epoch 200/200
1/1 [==============================] - 0s 32ms/step - loss: 0.0232 - val_loss: 0.1797

<tensorflow.python.keras.callbacks.History at 0x7fe7ba24d8b0>


                                        
                                            import matplotlib.pyplot as plt

def plot(y_true, y_pred, title=None):
    n_col = np.sqrt(y_true.shape[-1]).astype('int')
    n_row = np.ceil(y_true.shape[-1] / n_col).astype('int')
    fig, axes = plt.subplots(n_row, n_col, figsize=(10, 8))
    for i, ax in enumerate(axes.ravel()):
        ax.plot(y_true[0, :, i], label=f'{tickers[i]} true')
        ax.plot(y_pred[0, :, i], label=f'{tickers[i]} pred')
        ax.legend()
    fig.suptitle(title)


                                        
                                            y_pred_train = model.predict(X_train_scaled)
y_pred_test = model.predict(X_test_scaled)


                                        
                                            plot(y_train_scaled, y_pred_train, 'Predicted vs. actual prices for the training set')


                                        
                                            plot(y_test_scaled, y_pred_test, 'Predicted vs. actual prices for the test set')

	ETH-USD	BTC-USD	XLM-USD	XRP-USD	ADA-USD	LINK-USD
date
2020-05-01	214.219101	8864.766602	0.073222	0.219248	0.051260	3.783184
2020-05-02	215.325378	8988.596680	0.075450	0.223914	0.051014	3.822183
2020-05-03	210.933151	8897.468750	0.073106	0.219414	0.048929	3.722169
2020-05-04	208.174011	8912.654297	0.073738	0.218963	0.049664	3.767900
2020-05-05	206.774399	9003.070312	0.072445	0.216463	0.049358	3.687693

Anselme Borgeaud

Forecasting of cryptocurrency prices using a convolutional neural network¶

1. Closing price data¶

2. Training and test sets¶

3. Convolutional neural network (the model)¶

4. Training¶

5. Model check on training data, and validation on test data¶