In [7]:
import numpy as np
import tensorflow
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense

# 간단한 훈련 데이터: 영화 제목
movie_titles = [
    "The Shawshank Redemption",
    "The Godfather",
    "The Dark Knight",
    # 추가적인 영화들...
]

# 입력 데이터: 장르와 배우를 조합한 문자열
X_train = [
    "Action, Tom Cruise",
    "Crime, Marlon Brando",
    "Thriller, Christian Bale",
    # 추가적인 입력 데이터...
]

# 출력 데이터: 영화 제목
y_train = movie_titles

# 각 문자를 ASCII 코드로 변환하여 벡터화하는 함수
def text_to_vector(text):
    return [ord(char) for char in text]

# 입력 데이터를 벡터화
X_train_vectorized = [text_to_vector(text) for text in X_train]

# 배열로 변환
X_train_vectorized = np.array(X_train_vectorized)
y_train = np.array(y_train)

# 신경망 모델 정의
model = Sequential([
    Embedding(input_dim=128, output_dim=64, input_length=X_train_vectorized.shape[1]),
    LSTM(128),
    Dense(len(movie_titles), activation='softmax')
])

# 모델 컴파일
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 모델 학습
model.fit(X_train_vectorized, y_train, epochs=10, batch_size=1)

# 학습된 모델을 사용하여 특정 장르와 배우에 대한 영화 제목 예측
input_genre_actor = "Action, Tom Cruise"  # 예측할 장르와 배우
input_vector = np.array([text_to_vector(input_genre_actor)])  # 입력 데이터 벡터화
predicted_index = model.predict_classes(input_vector)
predicted_title = movie_titles[predicted_index[0]]
print("예측된 영화 제목:", predicted_title)


ValueError: setting an array element with a sequence. The requested array has an inhomogeneous shape after 1 dimensions. The detected shape was (3,) + inhomogeneous part.

In [8]:
import numpy as np
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense

# 간단한 훈련 데이터: 영화 제목
movie_titles = [
    "The Shawshank Redemption",
    "The Godfather",
    "The Dark Knight",
    # 추가적인 영화들...
]

# 입력 데이터: 장르와 배우를 조합한 문자열
X_train = [
    "Action, Tom Cruise",
    "Crime, Marlon Brando",
    "Thriller, Christian Bale",
    # 추가적인 입력 데이터...
]

# 출력 데이터: 영화 제목
y_train = movie_titles

# 각 문자를 ASCII 코드로 변환하여 벡터화하는 함수
def text_to_vector(text, max_length):
    vector = [ord(char) for char in text]
    # 최대 길이에 맞게 패딩 추가 또는 자르기
    vector = pad_sequences([vector], maxlen=max_length, padding='post', truncating='post')[0]
    return vector

# 모든 입력 데이터의 최대 길이 계산
max_length = max(len(text) for text in X_train)

# 입력 데이터를 벡터화
X_train_vectorized = [text_to_vector(text, max_length) for text in X_train]

# 배열로 변환
X_train_vectorized = np.array(X_train_vectorized)
y_train = np.array(y_train)

# 신경망 모델 정의
model = Sequential([
    Embedding(input_dim=128, output_dim=64, input_length=max_length),
    LSTM(128),
    Dense(len(movie_titles), activation='softmax')
])

# 모델 컴파일
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 모델 학습
model.fit(X_train_vectorized, y_train, epochs=10, batch_size=1)

# 학습된 모델을 사용하여 특정 장르와 배우에 대한 영화 제목 예측
input_genre_actor = "Action, Tom Cruise"  # 예측할 장르와 배우
input_vector = np.array([text_to_vector(input_genre_actor, max_length)])  # 입력 데이터 벡터화
predicted_index = model.predict_classes(input_vector)
predicted_title = movie_titles[predicted_index[0]]
print("예측된 영화 제목:", predicted_title)




ValueError: Invalid dtype: str768

In [10]:
import numpy as np
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense

# 간단한 훈련 데이터: 영화 제목
movie_titles = [
    "The Shawshank Redemption",
    "The Godfather",
    "The Dark Knight",
    # 추가적인 영화들...
]

# 입력 데이터: 장르와 배우를 조합한 문자열
X_train = [
    "Action, Tom Cruise",
    "Crime, Marlon Brando",
    "Thriller, Christian Bale",
    # 추가적인 입력 데이터...
]

# 출력 데이터: 영화 제목
y_train = movie_titles

# 각 문자를 ASCII 코드로 변환하여 벡터화하는 함수
def text_to_vector(text, max_length):
    vector = [ord(char) for char in text]
    # 최대 길이에 맞게 패딩 추가 또는 자르기
    # vector = pad_sequences([vector], maxlen=max_length, padding='post', truncating='post')[0]
    return vector

# 모든 입력 데이터의 최대 길이 계산
max_length = max(len(text) for text in X_train)

# 입력 데이터를 벡터화
X_train_vectorized = [text_to_vector(text, max_length) for text in X_train]

# 배열로 변환
X_train_vectorized = np.array(X_train_vectorized).tolist()
y_train = np.array(y_train)

# 신경망 모델 정의
model = Sequential([
    Embedding(input_dim=128, output_dim=64, input_length=max_length),
    LSTM(128),
    Dense(len(movie_titles), activation='softmax')
])

# 모델 컴파일
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 모델 학습
model.fit(X_train_vectorized, y_train, epochs=10, batch_size=1)

# 학습된 모델을 사용하여 특정 장르와 배우에 대한 영화 제목 예측
input_genre_actor = "Action, Tom Cruise"  # 예측할 장르와 배우
input_vector = np.array([text_to_vector(input_genre_actor, max_length)])  # 입력 데이터 벡터화
predicted_index = model.predict_classes(input_vector)
predicted_title = movie_titles[predicted_index[0]]
print("예측된 영화 제목:", predicted_title)



ValueError: setting an array element with a sequence. The requested array has an inhomogeneous shape after 1 dimensions. The detected shape was (3,) + inhomogeneous part.

In [11]:
import numpy as np
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense

# 간단한 훈련 데이터: 영화 제목
movie_titles = [
    "The Shawshank Redemption",
    "The Godfather",
    "The Dark Knight",
    # 추가적인 영화들...
]

# 입력 데이터: 장르와 배우를 조합한 문자열
X_train = [
    "Action, Tom Cruise",
    "Crime, Marlon Brando",
    "Thriller, Christian Bale",
    # 추가적인 입력 데이터...
]

# 출력 데이터: 영화 제목
y_train = movie_titles

# 각 문자를 ASCII 코드로 변환하여 벡터화하는 함수
def text_to_vector(text):
    vector = [ord(char) for char in text]
    return vector

# 모든 입력 데이터의 최대 길이 계산
max_length = max(len(text) for text in X_train)

# 입력 데이터를 벡터화하고 패딩 추가
X_train_padded = [text_to_vector(text) for text in X_train]
X_train_padded = pad_sequences(X_train_padded, maxlen=max_length, padding='post', truncating='post')

# 배열로 변환
X_train_vectorized = np.array(X_train_padded)
y_train = np.array(y_train)

# 신경망 모델 정의
model = Sequential([
    Embedding(input_dim=128, output_dim=64, input_length=max_length),
    LSTM(128),
    Dense(len(movie_titles), activation='softmax')
])

# 모델 컴파일
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 모델 학습
model.fit(X_train_vectorized, y_train, epochs=10, batch_size=1)

# 학습된 모델을 사용하여 특정 장르와 배우에 대한 영화 제목 예측
input_genre_actor = "Action, Tom Cruise"  # 예측할 장르와 배우
input_vector = np.array([text_to_vector(input_genre_actor)])  # 입력 데이터 벡터화
input_vector_padded = pad_sequences(input_vector, maxlen=max_length, padding='post', truncating='post')
predicted_index = model.predict_classes(input_vector_padded)
predicted_title = movie_titles[predicted_index[0]]
print("예측된 영화 제목:", predicted_title)


ValueError: Invalid dtype: str768