# 1. JANコードのバリデーション関数

問題:
JANコード（標準タイプ13桁、短縮タイプ8桁）の文字列が有効かどうかを判定する関数 validate_jan_code(jan_code) を作成してください。
有効なJANコードは、すべて数字で構成され、長さが13桁または8桁です。チェックデジットの計算までは不要とします。

期待される動作例:

```Python
validate_jan_code("4901234567890") # True (13桁)
validate_jan_code("1234567")      # False (7桁)
validate_jan_code("49012345")      # True (8桁)
validate_jan_code("490abcde")      # False (数字以外を含む)
validate_jan_code("")              # False (空文字)
```


In [None]:
def validate_jan_code(jan_code):
    if jan_code.isdigit():
        if len(jan_code) == 8 or len(jan_code) == 13:
            return True
        else:
            return False
    else:
        return False


In [13]:
print(validate_jan_code("4901234567890")) # True (13桁)
print(validate_jan_code("1234567"))      # False (7桁)
print(validate_jan_code("49012345"))      # True (8桁)
print(validate_jan_code("490abcde"))      # False (数字以外を含む)
print(validate_jan_code(""))              # False (空文字)



True
False
True
False
False


# 2. 商品データの正規化関数
問題:
商品名のリストを受け取り、各商品名を正規化する関数 normalize_product_names(names) を作成してください。正規化のルールは以下の通りです。

全角英数字および全角スペースを半角に変換する。
文字列の先頭と末尾の空白を削除する。
大文字・小文字を区別せず、すべて小文字に統一する。
期待される動作例:

```Python

names = ["　Ｐｒｏｄｕｃｔ　Ａ　", "ｐｒｏｄｕｃｔ　Ｂ　", "PRODUCT C"]
normalized = normalize_product_names(names)
# 期待される出力: ['product a', 'product b', 'product c']
```


In [24]:
import unicodedata

def normalize_product_names(names):
    normalized_names = []
    
    for name in names:
        # 全角英数字および全角スペースを半角に変換
        half_width_name = unicodedata.normalize('NFKC', name)
        
        # 先頭と末尾の空白を削除し、小文字に変換
        normalized_name = half_width_name.strip().lower()
        
        normalized_names.append(normalized_name)
    
    return normalized_names

In [None]:
names = ["　Ｐｒｏｄｕｃｔ　Ａ　", "ｐｒｏｄｕｃｔ　Ｂ　", "PRODUCT C"]
print(normalize_product_names(names))


['product a', 'product b', 'product c']


# 3. 商品名からのキーワード抽出関数
問題:
商品名の文字列と、抽出対象のキーワードリストを受け取り、商品名に含まれるキーワードを抽出してリストで返す関数 extract_keywords(product_name, keywords) を作成してください。キーワードの検索は、大文字・小文字を区別しないものとします。

期待される動作例:

```Python

product_name = "高品質オーガニックコットン Tシャツ Mサイズ ホワイト"
keywords = ["オーガニック", "コットン", "リネン", "ホワイト"]
extracted = extract_keywords(product_name, keywords)
# 期待される出力: ['オーガニック', 'コットン', 'ホワイト'] (順不同でも可)
```

In [None]:
def extract_keywords(produce_name, keywords):
    # 大文字と小文字の区別をなくす為、小文字で比較する
    product_name_lower = product_name.lower()
    extracted_keywords = [keyword for keyword in keywords if keyword.lower() in product_name_lower]

    return extracted_keywords


In [28]:
product_name = "高品質オーガニックコットン Tシャツ Mサイズ ホワイト"
keywords = ["オーガニック", "コットン", "リネン", "ホワイト"]
extracted = extract_keywords(product_name, keywords)
extracted


['オーガニック', 'コットン', 'ホワイト']

# 4. 価格文字列からの数値抽出関数
問題:
価格を表す文字列（例: "¥1,980 (税込)", "2,500円", "3000"）から、数値のみを抽出して整数型で返す関数 extract_price(price_str) を作成してください。通貨記号、カンマ、"円"、"(税込)"などの文字列は無視するものとします。数値として解釈できない場合は None を返してください。

期待される動作例:

```Python
extract_price("¥1,980 (税込)") # 1980
extract_price("2,500円")      # 2500
extract_price("3000")         # 3000
extract_price("特価")         # None
extract_price("送料無料")       # None
```

In [55]:
import re

def extract_price(price_str):
    price_number = re.findall(r'\d+', price_str)
    formatted_number = ''.join(price_number)

    if formatted_number:
        return formatted_number
    
    return None


In [57]:
print(extract_price("¥1,980 (税込)")) # 1980
print(extract_price("2,500円"))      # 2500
print(extract_price("3000"))         # 3000
print(extract_price("特価"))         # None
print(extract_price("送料無料"))       # None


1980
2500
3000
None
None


# 5. 商品辞書のリストから特定キーの値を集計する関数
問題:
商品の情報が格納された辞書のリストと、集計対象のキー名を受け取り、そのキーに対応する値の合計を返す関数 sum_values_from_dict_list(data_list, key) を作成してください。対象のキーが存在しない辞書や、値が数値でない場合はスキップ（0として加算）してください。

期待される動作例:

```Python
data = [
    {"name": "商品A", "price": 1000, "stock": 10},
    {"name": "商品B", "price": "N/A", "stock": 5}, # priceが数値でない
    {"name": "商品C", "stock": 20},             # priceキーがない
    {"name": "商品D", "price": 1500, "stock": 0}
]
total_price = sum_values_from_dict_list(data, "price")
# 期待される出力: 2500 (1000 + 0 + 0 + 1500)
total_stock = sum_values_from_dict_list(data, "stock")
# 期待される出力: 35 (10 + 5 + 20 + 0)
```

In [14]:
def sum_values_from_dict_list(data_list, key):

    total = 0
    for data in data_list:
        if key in data and isinstance(data[key], (int, float)):
            total += data[key]
    return total
    
    

In [16]:
data = [
    {"name": "商品A", "price": 1000, "stock": 10},
    {"name": "商品B", "price": "N/A", "stock": 5}, # priceが数値でない
    {"name": "商品C", "stock": 20},             # priceキーがない
    {"name": "商品D", "price": 1500, "stock": 0}
]
total_price = sum_values_from_dict_list(data, "price")
total_price
# 期待される出力: 2500 (1000 + 0 + 0 + 1500)

2500

In [18]:
total_stock = sum_values_from_dict_list(data, "stock")
total_stock
# 期待される出力: 35 (10 + 5 + 20 + 0)

35

# 6. 商品データの名寄せ（簡易版）
問題:
2つの商品名文字列を受け取り、それらが類似しているかどうかを判定する簡易的な関数 are_names_similar(name1, name2, threshold=0.7) を作成してください。
類似度の計算方法として、ここでは「共通する単語の割合」を用います。

各商品名をスペースで単語に分割します（句読点は無視して良い）。
両方の名前に含まれる共通の単語（大文字・小文字は区別しない）の数を数えます。
共通単語数を、両方の名前の総単語数のうち長い方で割った値を類似度とします。
類似度が指定された threshold 以上であれば True、そうでなければ False を返します。
期待される動作例:

```Python
are_names_similar("美味しいリンゴ 青森産", "青森産 美味しいリンゴ") # True
are_names_similar("美味しいミカン 和歌山産", "美味しいリンゴ 青森産") # False (共通単語が少ない)
are_names_similar("iPhone 15 Pro 256GB", "iPhone 15 Pro Max 512GB", threshold=0.6) # True (iPhone, 15, Proが共通)
```


# 7. APIレスポンス風JSONデータからの情報抽出
問題:
以下のような、商品情報を含むAPIレスポンスを模したJSON文字列が与えられます。このJSON文字列をパースし、各商品の name と price （amount の値）をタプルのリストとして返す関数 extract_product_info_from_json(json_string) を作成してください。 price 情報が存在しない商品はスキップしてください。

JSON文字列の例:

```JSON
{
  "count": 2,
  "products": [
    {
      "id": "A001",
      "name": "スマートウォッチ XYZ",
      "details": {"category": "ウェアラブル", "brand": "TechCo"},
      "price": {"amount": 15000, "currency": "JPY"}
    },
    {
      "id": "B002",
      "name": "ワイヤレスイヤホン Pro",
      "details": {"category": "オーディオ", "brand": "SoundMax"},
      "price": null
    },
    {
      "id": "C003",
      "name": "コーヒーメーカー Deluxe",
      "details": {"category": "家電", "brand": "HomeGoods"},
      "price": {"amount": 8000, "currency": "JPY"}
    }
  ]
}
```

期待される動作例:

```Python
json_data = """
{
  "count": 3,
  "products": [
    {"id": "A001", "name": "スマートウォッチ XYZ", "details": {"category": "ウェアラブル"}, "price": {"amount": 15000, "currency": "JPY"}},
    {"id": "B002", "name": "ワイヤレスイヤホン Pro", "details": {"category": "オーディオ"}, "price": null},
    {"id": "C003", "name": "コーヒーメーカー Deluxe", "details": {"category": "家電"}, "price": {"amount": 8000, "currency": "JPY"}}
  ]
}
"""
info = extract_product_info_from_json(json_data)
# 期待される出力: [('スマートウォッチ XYZ', 15000), ('コーヒーメーカー Deluxe', 8000)] (順不同でも可)
```

# 8. 商品説明文からの特徴タグ生成
問題:
商品説明文の文字列と、特徴語のリストを受け取り、商品説明文に含まれる特徴語をタグとして抽出する関数 generate_feature_tags(description, feature_words) を作成してください。抽出するタグは重複せず、大文字・小文字を区別しないものとします。

期待される動作例:

```Python

description = "この最新型スマートフォンは、防水機能と大容量バッテリーが特徴です。高速充電にも対応し、カメラ性能も向上しました。防水設計なので安心です。"
feature_words = ["防水", "大容量バッテリー", "高速充電", "カメラ", "軽量"]
tags = generate_feature_tags(description, feature_words)
# 期待される出力: {'防水', '大容量バッテリー', '高速充電', 'カメラ'} (セット型、順不同)
````

# 9. 在庫数に基づく商品ステータス判定
問題:
商品名と現在の在庫数を引数に取り、在庫状況に応じたステータス文字列を返す関数 get_product_status(product_name, stock_count) を作成してください。

在庫数が0の場合: "{商品名} は在庫切れです"
在庫数が1以上10以下の場合: "{商品名} は残りわずかです (残{在庫数}点)"
在庫数が10より多い場合: "{商品名} は在庫があります"
期待される動作例:

```Python
get_product_status("高機能マウス", 0)   # "高機能マウス は在庫切れです"
get_product_status("静音キーボード", 5)  # "静音キーボード は残りわずかです (残5点)"
get_product_status("27インチモニター", 50) # "27インチモニター は在庫があります"
```


# 10. 複数ECサイトの商品データ統合（簡易版）
問題:
異なるECサイトから収集した商品データのリスト（各リストは商品辞書のリスト）を複数受け取り、product_id をキーとしてデータをマージする関数 merge_product_data(*site_data_lists) を作成してください。
各商品辞書は product_id（必須）とその他の情報（例: price, name, source_site）を含みます。
マージのルールは以下の通りです。

同じ product_id の商品が見つかった場合、後から処理されるリストの情報で上書きします（価格など）。
ただし、source_site の情報はリストとして追記していくものとします（どのサイトでその商品が見つかったかを知るため）。
最終的に、統合された商品データ（product_id ごとに1つの辞書）のリストを返します。
期待される動作例:

```Python
site_a_data = [
    {"product_id": "101", "name": "商品X (A)", "price": 1000, "source_site": "SiteA"},
    {"product_id": "102", "name": "商品Y (A)", "price": 1500, "source_site": "SiteA"}
]
site_b_data = [
    {"product_id": "101", "name": "商品X (B)", "price": 980, "stock": 10, "source_site": "SiteB"}, # nameとpriceが更新される
    {"product_id": "103", "name": "商品Z (B)", "price": 2000, "source_site": "SiteB"}
]
site_c_data = [
    {"product_id": "101", "source_site": "SiteC"}, # priceはSiteBのまま、source_siteにSiteCが追加
    {"product_id": "102", "price": 1450, "source_site": "SiteC"}
]

merged_data = merge_product_data(site_a_data, site_b_data, site_c_data)
# merged_data の期待される内容 (順不同、内部のsource_siteのリストも順不同で可):
# [
#   {'product_id': '101', 'name': '商品X (B)', 'price': 980, 'stock': 10, 'source_site': ['SiteA', 'SiteB', 'SiteC']},
#   {'product_id': '102', 'name': '商品Y (A)', 'price': 1450, 'source_site': ['SiteA', 'SiteC']},
#   {'product_id': '103', 'name': '商品Z (B)', 'price': 2000, 'source_site': ['SiteB']}
# ]
```