# Bitcoin Script и типы транзакций

В этом notebook мы изучим:
1. Создание P2PKH scriptPubKey вручную с помощью `python-bitcoinlib`
2. Создание P2SH скрипта с мультиподписью
3. Декодирование скриптов в человекочитаемый формат
4. Создание P2WPKH witness program
5. Расчёт weight units и virtual bytes
6. Концептуальный пример Taproot с `bitcoin-utils`

**Библиотеки:**
- `python-bitcoinlib==0.12.2` -- для P2PKH, P2SH, SegWit
- `bitcoin-utils==0.7.3` -- для Taproot (P2TR)

> **Важно:** `python-bitcoinlib` НЕ поддерживает Taproot/P2TR. Для Taproot-примеров мы используем `bitcoin-utils`.

## 1. Импорт и настройка

In [None]:
# python-bitcoinlib: Script модули
from bitcoin.core.script import (
    CScript,
    OP_DUP, OP_HASH160, OP_EQUALVERIFY, OP_CHECKSIG,
    OP_EQUAL, OP_CHECKMULTISIG, OP_HASH256,
    OP_0, OP_1, OP_2, OP_3,
    OP_CHECKLOCKTIMEVERIFY, OP_CHECKSEQUENCEVERIFY, OP_DROP,
    OP_RETURN
)
from bitcoin.core import (
    Hash160, b2x, b2lx, lx, x,
    CMutableTransaction, CMutableTxIn, CMutableTxOut,
    COutPoint, CTxInWitness, CTxWitness, CScriptWitness
)
from bitcoin import SelectParams
import hashlib
import os

# Работаем в regtest сети
SelectParams('regtest')
print('Сеть: regtest')
print('Библиотека python-bitcoinlib готова')

## 2. Создание P2PKH scriptPubKey

P2PKH (Pay-to-Public-Key-Hash) -- классический тип Bitcoin-скрипта:

```
scriptPubKey: OP_DUP OP_HASH160 <pubKeyHash> OP_EQUALVERIFY OP_CHECKSIG
```

In [None]:
# Создаём P2PKH scriptPubKey вручную

# Сгенерируем условный публичный ключ (33 байта, compressed)
pubkey = bytes.fromhex(
    '0279be667ef9dcbbac55a06295ce870b07029bfcdb2dce28d959f2815b16f81798'
)
print(f'Публичный ключ (hex): {pubkey.hex()}')
print(f'Длина: {len(pubkey)} байт')

# Hash160 = RIPEMD-160(SHA-256(pubkey))
pubkey_hash = Hash160(pubkey)
print(f'\nHash160(pubkey): {pubkey_hash.hex()}')
print(f'Длина: {len(pubkey_hash)} байт')

# Собираем scriptPubKey
script_pubkey = CScript([
    OP_DUP,
    OP_HASH160,
    pubkey_hash,
    OP_EQUALVERIFY,
    OP_CHECKSIG
])

print(f'\nscriptPubKey (hex): {b2x(script_pubkey)}')
print(f'Длина скрипта: {len(script_pubkey)} байт')

In [None]:
# Декодируем scriptPubKey в человекочитаемый формат
print('Декодированный скрипт:')
for i, op in enumerate(script_pubkey):
    if isinstance(op, bytes):
        print(f'  [{i}] Data ({len(op)} bytes): {op.hex()}')
    else:
        # op -- это целое число (opcode)
        opcode_names = {
            0x76: 'OP_DUP',
            0xa9: 'OP_HASH160',
            0x88: 'OP_EQUALVERIFY',
            0xac: 'OP_CHECKSIG',
        }
        name = opcode_names.get(op, f'OP_0x{op:02x}')
        print(f'  [{i}] Opcode: {name} (0x{op:02x})')

## 3. Создание P2SH (Multisig)

P2SH позволяет спрятать сложный скрипт за коротким хешем.
Создадим 2-of-3 мультиподпись:

```
redeemScript: OP_2 <pk1> <pk2> <pk3> OP_3 OP_CHECKMULTISIG
scriptPubKey: OP_HASH160 <hash160(redeemScript)> OP_EQUAL
```

In [None]:
# Создаём 2-of-3 multisig redeemScript

# Три условных публичных ключа (33 байта каждый)
pk1 = bytes.fromhex('0279be667ef9dcbbac55a06295ce870b07029bfcdb2dce28d959f2815b16f81798')
pk2 = bytes.fromhex('02c6047f9441ed7d6d3045406e95c07cd85c778e4b8cef3ca7abac09b95c709ee5')
pk3 = bytes.fromhex('02f9308a019258c31049344f85f89d5229b531c845836f99b08601f113bce036f9')

# redeemScript: 2-of-3 мультиподпись
redeem_script = CScript([
    OP_2,          # m = 2 (нужно 2 подписи)
    pk1, pk2, pk3, # 3 публичных ключа
    OP_3,          # n = 3 (всего 3 ключа)
    OP_CHECKMULTISIG
])

print(f'redeemScript (hex): {b2x(redeem_script)}')
print(f'Длина redeemScript: {len(redeem_script)} байт')

# Hash160 от redeemScript
script_hash = Hash160(redeem_script)
print(f'\nHash160(redeemScript): {script_hash.hex()}')

# P2SH scriptPubKey
p2sh_script_pubkey = CScript([
    OP_HASH160,
    script_hash,
    OP_EQUAL
])

print(f'\nP2SH scriptPubKey (hex): {b2x(p2sh_script_pubkey)}')
print(f'Длина: {len(p2sh_script_pubkey)} байт')
print('\nОбратите внимание: P2SH scriptPubKey всегда 23 байта!')
print('Вся сложность redeemScript скрыта за 20-байтовым хешем.')

## 4. Декодирование скриптов

Научимся распознавать тип скрипта по его структуре.

In [None]:
def identify_script_type(script_hex: str) -> str:
    """Определяет тип scriptPubKey по шаблону байт."""
    script = CScript(bytes.fromhex(script_hex))
    ops = list(script)
    
    # P2PKH: OP_DUP OP_HASH160 <20 bytes> OP_EQUALVERIFY OP_CHECKSIG
    if (len(ops) == 5 and ops[0] == OP_DUP and ops[1] == OP_HASH160
            and isinstance(ops[2], bytes) and len(ops[2]) == 20
            and ops[3] == OP_EQUALVERIFY and ops[4] == OP_CHECKSIG):
        return 'P2PKH'
    
    # P2SH: OP_HASH160 <20 bytes> OP_EQUAL
    if (len(ops) == 3 and ops[0] == OP_HASH160
            and isinstance(ops[1], bytes) and len(ops[1]) == 20
            and ops[2] == OP_EQUAL):
        return 'P2SH'
    
    # P2WPKH: OP_0 <20 bytes>
    if (len(ops) == 2 and ops[0] == OP_0
            and isinstance(ops[1], bytes) and len(ops[1]) == 20):
        return 'P2WPKH (SegWit v0)'
    
    # P2WSH: OP_0 <32 bytes>
    if (len(ops) == 2 and ops[0] == OP_0
            and isinstance(ops[1], bytes) and len(ops[1]) == 32):
        return 'P2WSH (SegWit v0)'
    
    # P2TR: OP_1 <32 bytes>
    if (len(ops) == 2 and ops[0] == OP_1
            and isinstance(ops[1], bytes) and len(ops[1]) == 32):
        return 'P2TR (Taproot)'
    
    # OP_RETURN: data embedding
    if len(ops) >= 1 and ops[0] == OP_RETURN:
        return 'OP_RETURN (data)'
    
    return 'Unknown'


# Тестируем на наших скриптах
print('P2PKH scriptPubKey:', identify_script_type(b2x(script_pubkey)))
print('P2SH  scriptPubKey:', identify_script_type(b2x(p2sh_script_pubkey)))

# P2WPKH: OP_0 <20-byte-hash>
p2wpkh_spk = CScript([OP_0, pubkey_hash])
print('P2WPKH scriptPubKey:', identify_script_type(b2x(p2wpkh_spk)))

# P2WSH: OP_0 <32-byte-hash>
witness_script_hash = hashlib.sha256(redeem_script).digest()
p2wsh_spk = CScript([OP_0, witness_script_hash])
print('P2WSH scriptPubKey:', identify_script_type(b2x(p2wsh_spk)))

# P2TR: OP_1 <32-byte tweaked key>
fake_tweaked_key = os.urandom(32)
p2tr_spk = CScript([OP_1, fake_tweaked_key])
print('P2TR  scriptPubKey:', identify_script_type(b2x(p2tr_spk)))

## 5. Создание P2WPKH witness program

SegWit v0 P2WPKH -- самый распространённый тип транзакций сегодня.

```
scriptPubKey: OP_0 <20-byte witness program>
witness: <sig> <pubKey>
scriptSig: (пустой!)
```

In [None]:
# Создание P2WPKH

# Witness program = Hash160(pubkey)
witness_program = Hash160(pubkey)

# scriptPubKey для P2WPKH
p2wpkh_script = CScript([OP_0, witness_program])

print(f'P2WPKH scriptPubKey: {b2x(p2wpkh_script)}')
print(f'Длина: {len(p2wpkh_script)} байт')
print(f'\nОП_0 = version byte (0x00) -> SegWit v0')
print(f'Witness program (20 bytes) = Hash160(pubkey)')
print(f'\nДекодируем:')
for op in p2wpkh_script:
    if isinstance(op, bytes):
        print(f'  Witness program: {op.hex()} ({len(op)} bytes)')
    elif op == 0:
        print(f'  OP_0 (witness version 0)')

## 6. Сравнение размеров транзакций и Weight Units

Формула SegWit weight:

```
weight = non_witness_bytes * 4 + witness_bytes * 1
vB = weight / 4
```

In [None]:
def calculate_weight(non_witness_bytes: int, witness_bytes: int) -> dict:
    """Рассчитывает weight units и virtual bytes."""
    weight = non_witness_bytes * 4 + witness_bytes * 1
    vbytes = weight / 4
    total_bytes = non_witness_bytes + witness_bytes
    return {
        'non_witness': non_witness_bytes,
        'witness': witness_bytes,
        'total_bytes': total_bytes,
        'weight_units': weight,
        'virtual_bytes': vbytes,
    }


# Типичные размеры (1 вход, 2 выхода)
tx_types = {
    'P2PKH': calculate_weight(
        non_witness_bytes=226,  # Всё -- non-witness (нет witness)
        witness_bytes=0
    ),
    'P2WPKH': calculate_weight(
        non_witness_bytes=100,  # version + marker + flag + inputs + outputs + locktime
        witness_bytes=107       # sig (~72) + pubkey (33) + overhead (~2)
    ),
    'P2TR': calculate_weight(
        non_witness_bytes=100,  # Аналогично P2WPKH
        witness_bytes=66        # Schnorr sig (64) + overhead (~2)
    ),
}

print('=== Сравнение типов транзакций (1 вход, 2 выхода) ===\n')
print(f'{"Тип":<10} {"Non-W":>8} {"Witness":>8} {"Total":>8} {"WU":>8} {"vB":>8} {"Экон.":>8}')
print('-' * 60)

baseline_vb = tx_types['P2PKH']['virtual_bytes']

for name, data in tx_types.items():
    savings = (1 - data['virtual_bytes'] / baseline_vb) * 100
    print(
        f'{name:<10} '
        f'{data["non_witness"]:>7}B '
        f'{data["witness"]:>7}B '
        f'{data["total_bytes"]:>7}B '
        f'{data["weight_units"]:>7} '
        f'{data["virtual_bytes"]:>7.1f} '
        f'{savings:>6.1f}%'
    )

print('\n--- Формула ---')
print('weight = non_witness_bytes * 4 + witness_bytes * 1')
print('vB = weight / 4')
print('\nLegacy P2PKH: weight = 226 * 4 + 0 = 904 WU, vB = 226')
print('SegWit P2WPKH: weight = 100 * 4 + 107 = 507 WU, vB = 126.75')

In [None]:
# Расчёт экономии на комиссии

FEE_RATE_SAT_PER_VB = 10  # 10 sat/vB (типичная комиссия)

print(f'Комиссия при {FEE_RATE_SAT_PER_VB} sat/vB:\n')
for name, data in tx_types.items():
    fee_sat = data['virtual_bytes'] * FEE_RATE_SAT_PER_VB
    fee_btc = fee_sat / 1e8
    print(f'{name:<10}: {fee_sat:>7.0f} sat  ({fee_btc:.8f} BTC)')

savings_wpkh = (tx_types['P2PKH']['virtual_bytes'] - tx_types['P2WPKH']['virtual_bytes'])
savings_tr = (tx_types['P2PKH']['virtual_bytes'] - tx_types['P2TR']['virtual_bytes'])
print(f'\nЭкономия P2WPKH vs P2PKH: {savings_wpkh * FEE_RATE_SAT_PER_VB:.0f} sat на транзакцию')
print(f'Экономия P2TR vs P2PKH:   {savings_tr * FEE_RATE_SAT_PER_VB:.0f} sat на транзакцию')

## 7. Taproot (P2TR) с bitcoin-utils

`python-bitcoinlib` **не поддерживает Taproot**. Для P2TR используем `bitcoin-utils==0.7.3`.

```bash
pip install bitcoin-utils==0.7.3
```

Ниже -- концептуальный пример создания P2TR адреса и key-path траты.

In [None]:
from bitcoinutils.setup import setup
from bitcoinutils.keys import PrivateKey, PublicKey
from bitcoinutils.transactions import Transaction, TxInput, TxOutput
from bitcoinutils.script import Script

# Настройка для regtest
setup('regtest')

# 1. Генерация ключевой пары
priv_key = PrivateKey()
pub_key = priv_key.get_public_key()

print('=== Taproot (P2TR) с bitcoin-utils ===')
print(f'Приватный ключ (WIF): {priv_key.to_wif()}')
print(f'Публичный ключ: {pub_key.to_hex()}')

# 2. Получение Taproot адреса (tweaked key)
taproot_address = pub_key.get_taproot_address()
print(f'\nP2TR адрес: {taproot_address.to_string()}')
print(f'Формат: bech32m (bcrt1p... для regtest)')

# 3. Для сравнения -- P2WPKH адрес того же ключа
segwit_address = pub_key.get_segwit_address()
print(f'\nP2WPKH адрес: {segwit_address.to_string()}')
print(f'Формат: bech32 (bcrt1q... для regtest)')

print('\n--- Taproot tweaking ---')
print('Q = P + t*G')
print('где t = tagged_hash("TapTweak", P)')
print('Key path spend: одна Schnorr подпись (64 байта)')
print('Все P2TR выходы выглядят одинаково: OP_1 <32 bytes>')

## 8. Декодирование транзакций через RPC

Если запущен Bitcoin Core на regtest, можно декодировать реальные транзакции.

In [None]:
# Подключение к regtest Bitcoin Core (если запущен)
try:
    from bitcoin.rpc import Proxy
    rpc = Proxy(service_url='http://student:learn@localhost:18443')
    
    # Получаем последний блок
    block_count = rpc.getblockcount()
    print(f'Текущая высота блока: {block_count}')
    
    # Получаем хеш блока
    block_hash = rpc.getblockhash(block_count)
    print(f'Хеш последнего блока: {b2lx(block_hash)}')
    
    # Получаем блок
    block = rpc.getblock(block_hash)
    print(f'Транзакций в блоке: {len(block.vtx)}')
    
    # Coinbase транзакция
    coinbase_tx = block.vtx[0]
    print(f'\nCoinbase txid: {b2lx(coinbase_tx.GetTxid())}')
    
    # Декодируем scriptPubKey выхода
    for i, out in enumerate(coinbase_tx.vout):
        print(f'\nВыход {i}:')
        print(f'  Сумма: {out.nValue / 1e8:.8f} BTC')
        spk_hex = b2x(out.scriptPubKey)
        print(f'  scriptPubKey: {spk_hex}')
        print(f'  Тип: {identify_script_type(spk_hex)}')
        
except Exception as e:
    print(f'Bitcoin Core не доступен: {e}')
    print('Запустите: docker compose up (в директории labs/bitcoin/)')

## 9. Упражнения

### Упражнение 1: P2SH-wrapped multisig

Создайте 3-of-5 multisig redeemScript и соответствующий P2SH scriptPubKey.
Сколько байт занимает redeemScript?

In [None]:
# Упражнение 1: создайте 3-of-5 multisig
# Подсказка: используйте OP_3 и OP_5 (= 0x55)
# Сгенерируйте 5 условных публичных ключей

# Ваш код здесь:


### Упражнение 2: Weight savings для P2TR vs P2PKH

Рассчитайте weight и vB для транзакции с 3 входами и 2 выходами.
Типичные размеры для 3-in, 2-out:
- P2PKH: ~520 non-witness bytes, 0 witness
- P2TR: ~200 non-witness bytes, ~198 witness bytes (3 * 66)

In [None]:
# Упражнение 2: рассчитайте weight для 3-in, 2-out транзакции
# Используйте функцию calculate_weight() определённую выше

# Ваш код здесь:


### Упражнение 3: Decode SegWit witness data

Дан raw witness для P2WPKH транзакции (hex). Декодируйте его:
- Первый элемент: ECDSA подпись (DER-формат)
- Второй элемент: compressed публичный ключ (33 bytes)

In [None]:
# Упражнение 3: декодирование witness data
# Формат witness: [count] [len1] [item1] [len2] [item2]
# Пример raw witness hex:
raw_witness = (
    '02'  # 2 элемента в witness
    '47'  # длина первого элемента: 71 байт (подпись)
    '304402207f3ade43de0fc3e7a4d5b1adaa08da99fce1b6960c0'
    '7e45d085b6d4e32a9602206c4f42c4f0e5e0e3b5a3d8c7f6e5'
    'd4c3b2a1908070605040302010001'  # DER подпись
    '21'  # длина второго элемента: 33 байта (pubkey)
    '0279be667ef9dcbbac55a06295ce870b07029bfcdb2dce28d959f2815b16f81798'  # compressed pubkey
)

# Декодируйте witness data: выделите подпись и публичный ключ

# Ваш код здесь:
