# 如何用Python探索星系觀測資料？
此notebook為[「用Python探索天文：從資料取得到視覺化」](https://github.com/YihaoSu/exploring-astronomy-with-python-from-data-query-to-visualization)一書的相關程式碼，由[蘇羿豪](https://astrobackhacker.tw/)編寫，並以[MIT授權條款](https://github.com/YihaoSu/exploring-astronomy-with-python-from-data-query-to-visualization/blob/main/LICENSE)釋出。「用Python探索天文：從資料取得到視覺化」是「[天文的資料再創作](https://docs.google.com/forms/d/e/1FAIpQLSfGqlySaOVfWK-ZCeouJj4Ji6hJbBeLgK0B1ddpi16vR2ZvUQ/viewform)」及「[天文的資料科學](https://docs.google.com/forms/d/e/1FAIpQLSdSjnrvdsqAtALGfIMxXhQMZ9PRO-e_2ML6kzg6tjqyHNl1eA/viewform)」這兩個天文教育產品開發計畫的一部分，如果你想要體驗更多關於天文資料的有趣旅程，歡迎填寫這兩個計畫連結中的調查表單，讓我能根據你的需求及建議，開發出能拉近你與星空的距離的產品。

## (一) 哪些平台有將星系觀測資料開放給⼤眾使⽤？
以下列出幾個可以下載到星系觀測資料的平台：

### SkyServer SDSS
[SkyServer SDSS](https://skyserver.sdss.org)是一個用來查詢和下載[Sloan Digital Sky Survey(SDSS)](https://zh.wikipedia.org/wiki/%E5%8F%B2%E9%9A%86%E6%95%B8%E4%BD%8D%E5%B7%A1%E5%A4%A9)觀測資料的網站。SDSS是一個以美國新墨西哥州阿帕契點天文台的2.5公尺光學望遠鏡進行的巡天調查計畫。為了了解星系的分布、結構、形成和演化，SDSS收集了大量的天體影像和光譜資料。

### NASA/IPAC Extragalactic Database(NED)
[NED](https://ned.ipac.caltech.edu/)是由美國太空總署資助並由IPAC(Infrared Processing and Analysis Center)營運的天文資料庫，提供星系等銀河系外天體的資訊查詢及觀測資料下載服務。

### Mikulski Archive for Space Telescopes(MAST)
[MAST](https://archive.stsci.edu/)是一個天文觀測資料中心，專門存儲和管理多個太空及地面天文觀測計畫的資料。透過它的網站，你能夠搜尋並下載韋伯和哈伯太空望遠鏡所觀測的星系影像及光譜資料。

## (二) 如何用Python取得星系觀測資料？

[Astroquery](https://astroquery.readthedocs.io/en/latest/)是一個能串接不同天文資料庫服務以方便取得各種天文資料的Python套件。它提供多個模組，用於查詢不同的天文資料庫服務。其中，[sdss模組](https://astroquery.readthedocs.io/en/latest/sdss/sdss.html)是用來取得SDSS的資料，NED的資料能用[ipac.ned模組](https://astroquery.readthedocs.io/en/latest/ipac/ned/ned.html)取得，而[mast模組](https://astroquery.readthedocs.io/en/latest/mast/mast.html)則可以取得MAST的資料。執行以下指令以安裝Astroquery：

In [None]:
pip install -U --pre astroquery

### 範例1：使用ipac.ned模組來查詢NED提供的星系基本資訊、影像及光譜資料

In [1]:
# 引入ipac.ned模組中的Ned類別，用於查詢NED提供的星系資料
from astroquery.ipac.ned import Ned

# 定義要查詢的星系名稱
galaxy_name = 'M104'

# 使用Ned物件的query_object()方法來查詢星系的基本資訊
ned_query_result_table = Ned.query_object(galaxy_name)
print(f'{galaxy_name}星系基本資訊：')
print(ned_query_result_table)

# 使用Ned物件的get_images_async()方法來取得星系的影像資料，它會回傳一個串列，其中每個元素代表不同的影像資料物件
ned_images = Ned.get_images_async(galaxy_name)

# 顯示第一個影像FITS檔案的資訊，並取出其影像的像素值資料
print('影像資料FITS檔案資訊：')
ned_images[0].get_fits().info()
print('影像的像素資料：')
ned_image_data = ned_images[0].get_fits()[0].data
print(ned_image_data)

# 使用Ned物件的get_spectra_async()方法來取得星系的光譜資料，它會回傳一個串列，其中每個元素代表不同的光譜資料物件
ned_spectra = Ned.get_spectra_async(galaxy_name)

# 顯示最後一個光譜FITS檔案的資訊，並取出其光譜資料
print('光譜資料FITS檔案資訊：')
ned_spectra[-1].get_fits().info()
print('光譜資料：')
ned_spectrum_data = ned_spectra[-1].get_fits()[1].data
print(ned_spectrum_data)

M104星系基本資訊：
No. Object Name     RA        DEC     Type  Velocity  ... Photometry Points Positions Redshift Points Diameter Points Associations
                 degrees    degrees          km / s   ...                                                                         
--- ----------- ---------- ---------- ---- ---------- ... ----------------- --------- --------------- --------------- ------------
  1 MESSIER 104  189.99763  -11.62305    G     1091.0 ...               357        95              40               7            0
影像資料FITS檔案資訊：
Filename: (No file associated with this HDUList)
No.    Name      Ver    Type      Cards   Dimensions   Format
  0  PRIMARY       1 PrimaryHDU     106   (424, 424)   int16   
影像的像素資料：
[[5313 5392 5392 ... 5436 5121 5121]
 [5156 5550 5235 ... 5436 5436 5279]
 [5471 5550 5865 ... 5751 5751 5909]
 ...
 [5361 5913 5598 ... 6378 5748 5748]
 [5361 5598 5283 ... 6378 5748 5748]
 [5283 5598 5913 ... 5984 5669 6142]]
光譜資料FITS檔案資訊：
Filename: (No file assoc

### 範例2：使用sdss模組來取得SDSS觀測的星系影像及光譜資料

In [2]:
# 引入sdss模組中的SDSS類別，用於查詢SDSS觀測的星系資料
from astroquery.sdss import SDSS
# 從astropy套件引入SkyCoord類別，用於處理天體座標
from astropy.coordinates import SkyCoord

# 定義一個用於取得星系的(RA,DEC)座標的函式
def get_galaxy_coordinates(galaxy_name):
    try:
        # 使用SkyCoord的from_name()方法根據星系名稱查詢其座標
        galaxy_coordinates = SkyCoord.from_name(galaxy_name)
        return galaxy_coordinates
    except Exception as e:
        # 如果查詢過程中出現異常錯誤，輸出錯誤訊息並回傳None
        print(f'星系座標取得失敗，錯誤訊息： {e}')
        return None

# 定義一個用於取得SDDS提供的星系影像和光譜資料的函式
def fetch_galaxy_data_from_sdss(galaxy_coordinates, data_type='both'):
    try:
        # 檢查data_type參數是否有效
        if data_type not in ['image', 'spectrum', 'both']:
            raise ValueError('data_type參數必須是"image"、"spectrum"或"both"其中之一')

        # 根據data_type參數的值，從SDSS資料庫中查詢影像資料
        if data_type in ['image', 'both']:
            # 使用SDSS物件的get_images()方法來取得特定星系的影像觀測資料
            sdss_images = SDSS.get_images(coordinates=galaxy_coordinates)
            if not sdss_images:
                print('未找到影像資料')
                sdss_images = None
        else:
            sdss_images = None
        
        # 根據data_type參數的值，從SDSS資料庫中查詢光譜資料
        if data_type in ['spectrum', 'both']:
            # 使用SDSS物件的get_spectra()方法來取得特定星系的光譜觀測資料
            sdss_spectra = SDSS.get_spectra(coordinates=galaxy_coordinates)
            if not sdss_spectra:
                print('未找到光譜資料')
                sdss_spectra = None
        else:
            sdss_spectra = None
        
        return sdss_images, sdss_spectra
    except Exception as e:
        # 如果查詢過程中出現異常錯誤，輸出錯誤訊息並回傳None, None
        print(f'星系資料取得失敗，錯誤訊息： {e}')
        return None, None

# 設定要查詢的星系名稱
galaxy_name = 'NGC 7319'
# 取得星系座標
galaxy_coordinates = get_galaxy_coordinates(galaxy_name)  
print(f'{galaxy_name}星系的(RA, DEC)座標：{galaxy_coordinates}')
if galaxy_coordinates:
    # 如果成功取得星系座標，則呼叫fetch_galaxy_data_from_sdss()函式來取得星系的觀測資料
    sdss_images, sdss_spectra = fetch_galaxy_data_from_sdss(galaxy_coordinates)
    if sdss_images:
        print('FITS檔案影像資料串列：')
        print(sdss_images)
    if sdss_spectra:
        print('FITS檔案光譜資料串列：')
        print(sdss_spectra)

NGC 7319星系的(RA, DEC)座標：<SkyCoord (ICRS): (ra, dec) in deg
    (339.015009, 33.975882)>
未找到光譜資料
FITS檔案影像資料串列：
[[<astropy.io.fits.hdu.image.PrimaryHDU object at 0x7f4a35578be0>, <astropy.io.fits.hdu.image.ImageHDU object at 0x7f4a35578580>, <astropy.io.fits.hdu.table.BinTableHDU object at 0x7f4a3557ad40>, <astropy.io.fits.hdu.table.BinTableHDU object at 0x7f4a35579d80>]]




### 範例3：使用mast模組來取得MAST提供的星系影像及光譜資料

In [3]:
# 引入mast模組中的Observations類別，用於查詢MAST提供的星系觀測資料
from astroquery.mast import Observations
# 引入astropy中的fits子套件，用於FITS檔案的操作
from astropy.io import fits

# 定義一個用於取得MAST提供的星系影像和光譜資料的函式
def fetch_galaxy_data_from_mast(galaxy_name, telescope='HST', data_type='IMAGE', observation_index=0, product_index=0):
    try:
        # 檢查telescope參數是否為有效值，HST代表哈伯太空望遠鏡，JWST代表韋伯太空望遠鏡
        if telescope not in ['HST', 'JWST']:
            raise ValueError('telescope參數必須是"HST"或"JWST"其中之一')
        # 檢查data_type參數是否為有效值
        if data_type not in ['IMAGE', 'SPECTRUM']:
            raise ValueError('data_type參數必須是"IMAGE"或"SPECTRUM"其中之一')

        # 使用Observations物件的query_criteria()、get_product_list()和download_products()等方法來查詢並下載特定星系的觀測資料
        obs_table = Observations.query_criteria(objectname=galaxy_name, obs_collection=telescope, dataproduct_type=data_type)
        print(f'找到 {len(obs_table)} 筆觀測，請查看回傳的obs_table變數')
        
        if len(obs_table) == 0:
            return obs_table, None, None

        # 檢查observation_index參數是否在有效範圍內
        if observation_index >= len(obs_table):
            print('輸入的observation_index參數超出obs_table的觀測筆數，請修改')
            return obs_table, None, None
        
        product_list_table = Observations.get_product_list(obs_table[observation_index])
        print(f'你選擇obs_table中的第 {observation_index + 1} 筆觀測，該觀測有 {len(product_list_table)} 筆觀測資料，請查看回傳的product_list_table變數')

        # 檢查product_index參數是否在有效範圍內
        if product_index >= len(product_list_table):
            print('輸入的product_index參數超出product_list_table的觀測資料筆數，請修改')
            return obs_table, product_list_table, None

        print(f'正在下載product_list_table中的第 {product_index + 1} 筆觀測資料，請稍後......')
        downloaded_product_table = Observations.download_products(product_list_table[product_index], extension='fits')
        print('下載成功！請查看回傳的downloaded_product_table變數')
        return obs_table, product_list_table, downloaded_product_table

    except Exception as e:
        print(f'星系資料取得失敗，錯誤訊息： {e}')
        return None, None, None

# 設定要查詢的星系名稱
galaxy_name = 'M104'
# 呼叫fetch_galaxy_data_from_mast()函式來查詢並下載星系的觀測資料
obs_table, product_list_table, downloaded_product_table = fetch_galaxy_data_from_mast(
    galaxy_name, observation_index=14, product_index=9
)
# 如果成功下載觀測資料，則顯示下載的FITS檔案資訊
if downloaded_product_table:
    print(downloaded_product_table)
    filename = downloaded_product_table[0]['Local Path']
    hdu_list = fits.open(filename)
    hdu_list.info()

找到 470 筆觀測，請查看回傳的obs_table變數
你選擇obs_table中的第 15 筆觀測，該觀測有 13 筆觀測資料，請查看回傳的product_list_table變數
正在下載product_list_table中的第 10 筆觀測資料，請稍後......
Downloading URL https://mast.stsci.edu/api/v0.1/Download/file?uri=mast:HST/product/w0lc0701t_d0f.fits to ./mastDownload/HST/w0lc0701t/w0lc0701t_d0f.fits ... [Done]
下載成功！請查看回傳的downloaded_product_table變數
                   Local Path                    Status  Message URL 
----------------------------------------------- -------- ------- ----
./mastDownload/HST/w0lc0701t/w0lc0701t_d0f.fits COMPLETE    None None
Filename: ./mastDownload/HST/w0lc0701t/w0lc0701t_d0f.fits
No.    Name      Ver    Type      Cards   Dimensions   Format
  0  PRIMARY       1 PrimaryHDU     194   (800, 800, 4)   int16   
  1  w0lc0701t.d0h.tab    1 TableHDU       158   4R x 37C   [D25.16, D25.16, E15.7, E15.7, E15.7, E15.7, E15.7, E15.7, E15.7, E15.7, A4, E15.7, I11, I11, D25.16, D25.16, A8, A8, I11, E15.7, E15.7, E15.7, E15.7, E15.7, E15.7, I11, I11, I11, I11, I11, I11, I11, A24

## (三) 如何用Python視覺化探索星系觀測資料？

[Jdaviz](https://jdaviz.readthedocs.io)是一個基於Jupyter notebook環境的天文資料視覺化分析套件，由[Space Telescope Science Institute](https://zh.wikipedia.org/zh-tw/%E5%A4%AA%E7%A9%BA%E6%9C%9B%E9%81%A0%E9%8F%A1%E7%A7%91%E5%AD%B8%E7%A0%94%E7%A9%B6%E6%89%80)開發，主要用於韋伯太空望遠鏡的資料視覺化探索。它提供[Imviz](https://jdaviz.readthedocs.io/en/latest/imviz/index.html)、[Specviz](https://jdaviz.readthedocs.io/en/latest/specviz/index.html)等工具，讓使用者能透過圖形化介面操作影像及光譜資料的視覺化，並進行初步的分析。
執行以下指令以安裝Jdaviz(註：目前Google Colab環境尚未支援Jdaviz，安裝過程會發生版本衝突，所以請用其他的Jupyter notebook環境)：

In [None]:
pip install jdaviz 

### 範例1：視覺化探索韋伯太空望遠鏡觀測星系團[Abell 2744](https://zh.wikipedia.org/zh-tw/%E9%98%BF%E8%B2%9D%E7%88%BE_2744)的影像資料

In [4]:
# 引入mast模組中的Observations類別，用於查詢MAST提供的星系觀測資料
from astroquery.mast import Observations
# 從jdaviz套件中引入Imviz類別，用來視覺化天文影像資料
from jdaviz import Imviz

# 使用Observations類別的query_criteria()方法來查詢韋伯太空望遠鏡觀測星系團Abell 2744的影像資料
obs_table = Observations.query_criteria(target_name='Abell2744', obs_collection='JWST', dataproduct_type='IMAGE')

# 將回傳的查詢結果(astropy的table物件)轉換成Pandas的dataframe物件，以便操作資料篩選
obs_table_df = obs_table.to_pandas()

# 進行資料篩選，並取得篩選後的第一筆資料在原本obs_table中的索引，然後以該索引取得相應的product_list_table
obs_table_df = obs_table_df[(obs_table_df['t_exptime'] > 5000) & (obs_table_df['filters'] == 'F444W')]
obs_table_index = obs_table_df.index[0]
product_list_table = Observations.get_product_list(obs_table[obs_table_index])

# 將product_list_table(astropy的table物件)轉換成Pandas的dataframe物件，以便操作資料篩選
product_list_table_df = product_list_table.to_pandas()

# 進行資料篩選，並取得篩選後的最後一筆資料在原本product_list_table中的索引，然後以該索引下載相應的觀測資料FITS檔
product_list_table_df = product_list_table_df[(product_list_table_df['productType'] == 'SCIENCE') & (product_list_table_df['description'].str.contains('rectified 2D image'))]
product_list_table_index = product_list_table_df.index[-1]
downloaded_product_table = Observations.download_products(product_list_table[product_list_table_index], extension='fits')

# 取得下載到的觀測資料FITS檔案路徑，並且用Imviz物件的load_data()和show()方法來載入和視覺化影像資料
downloaded_fits_filepath = downloaded_product_table[0]['Local Path']
imviz = Imviz()
imviz.load_data(downloaded_fits_filepath)
imviz.show()

Downloading URL https://mast.stsci.edu/api/v0.1/Download/file?uri=mast:JWST/product/jw01324001001_12201_00003_nrcblong_i2d.fits to ./mastDownload/JWST/jw01324001001_12201_00003_nrcblong/jw01324001001_12201_00003_nrcblong_i2d.fits ... [Done]


Application(config='imviz', docs_link='https://jdaviz.readthedocs.io/en/v3.7.0/imviz/index.html', events=['cal…

### 範例2：視覺化探索韋伯太空望遠鏡觀測類星體[SDSS J0100+2802](https://zh.wikipedia.org/zh-tw/SDSS_J0100%2B2802)的光譜資料

In [5]:
# 引入mast模組中的Observations類別，用於查詢MAST提供的星系觀測資料
from astroquery.mast import Observations
# 從jdaviz套件中引入Specviz類別，用來視覺化天文光譜資料
from jdaviz import Specviz

# 使用Observations類別的query_criteria()方法來查詢韋伯太空望遠鏡觀測類星體SDSS J0100+2802的光譜資料
obs_table = Observations.query_criteria(target_name='J0100+2802', obs_collection='JWST', dataproduct_type='SPECTRUM')

# 將回傳的查詢結果(astropy的table物件)轉換成Pandas的dataframe物件，以便操作資料篩選
obs_table_df = obs_table.to_pandas()

# 進行資料篩選，並取得篩選後的第一筆資料在原本obs_table中的索引，然後以該索引取得相應的product_list_table
obs_table_df = obs_table_df[obs_table_df['target_classification'].fillna('').str.contains('Quasars')]
obs_table_index = obs_table_df.index[0]
product_list_table = Observations.get_product_list(obs_table[obs_table_index])

# 將product_list_table(astropy的table物件)轉換成Pandas的dataframe物件，以便操作資料篩選
product_list_table_df = product_list_table.to_pandas()

# 進行資料篩選，並取得篩選後的最後一筆資料在原本product_list_table中的索引，然後以該索引下載相應的觀測資料FITS檔
product_list_table_df = product_list_table_df[(product_list_table_df['productType'] == 'SCIENCE') & (product_list_table_df['description'].str.contains('1D extracted spectrum'))]
product_list_table_index = product_list_table_df.index[-1]
downloaded_product_table = Observations.download_products(product_list_table[product_list_table_index], extension='fits')

# 取得下載到的觀測資料FITS檔案路徑，並且用Specviz物件的load_data()和show()方法來載入和視覺化光譜資料
downloaded_fits_filepath = downloaded_product_table[0]['Local Path']
specviz = Specviz()
specviz.load_data(downloaded_fits_filepath)
specviz.show()

Downloading URL https://mast.stsci.edu/api/v0.1/Download/file?uri=mast:JWST/product/jw01243001004_04101_00012_nrcblong_x1d.fits to ./mastDownload/JWST/jw01243001004_04101_00012_nrcblong/jw01243001004_04101_00012_nrcblong_x1d.fits ... [Done]


Application(config='specviz', docs_link='https://jdaviz.readthedocs.io/en/v3.7.0/specviz/index.html', events=[…