In [1]:
import time
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split

from BioseqSuite import DNASequence, RNASequence, AminoAcidSequence
from custom_random_forest import RandomForestClassifierCustom

In [2]:
X, y = make_classification(n_samples=100000)
random_forest = RandomForestClassifierCustom(max_depth=30, n_estimators=10, max_features=2, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Измерение времени обучения с 1 потоком
start_time = time.time()
random_forest.fit(X_train, y_train, n_jobs=1)
fit_time_1_thread = time.time() - start_time

# Измерение времени обучения с 2 потоками
start_time = time.time()
random_forest.fit(X_train, y_train, n_jobs=2)
fit_time_2_threads = time.time() - start_time

# Измерение времени предсказания с 1 потоком
start_time = time.time()
y_pred_1_thread = random_forest.predict(X_test, n_jobs=1)
predict_time_1_thread = time.time() - start_time

# Измерение времени предсказания с 2 потоками
start_time = time.time()
y_pred_2_threads = random_forest.predict(X_test, n_jobs=2)
predict_time_2_threads = time.time() - start_time

# Проверка совпадения предсказаний
predictions_match = (y_pred_1_thread == y_pred_2_threads).all()

# Вывод результатов
print("Время выполнения fit с 1 потоком:", fit_time_1_thread)
print("Время выполнения fit с 2 потоками:", fit_time_2_threads)
print("Время выполнения predict с 1 потоком:", predict_time_1_thread)
print("Время выполнения predict с 2 потоками:", predict_time_2_threads)
print("Полученные предсказания совпадают:", predictions_match)

Время выполнения fit с 1 потоком: 12.844643592834473
Время выполнения fit с 2 потоками: 9.130913257598877
Время выполнения predict с 1 потоком: 0.34749579429626465
Время выполнения predict с 2 потоками: 0.30484747886657715
Полученные предсказания совпадают: True


In [4]:
# Создание объекта DNASequence
dna_seq = DNASequence("ATCG")
print(dna_seq.__len__())
print(dna_seq.gc_content())

4
0.5


In [6]:
# Транскрипция
rna_seq = dna_seq.transcribe()
print(rna_seq.__str__())

AUCG


In [8]:
# Создание объекта RNASequence
rna_seq2 = RNASequence("AUCG")
print(rna_seq2.__str__())
print(rna_seq2.__len__())
print(rna_seq2.complement().__str__())

AUCG
4
UAGC


In [10]:
# Создание объекта AminoAcidSequence
aa_seq = AminoAcidSequence("ARND")
print(aa_seq.__str__())
print(aa_seq.__len__())
print(aa_seq.molecular_weight())

ARND
4
528.51
