In [1]:
from datasets import Dataset
import pandas as pd
import glob
from underthesea import sent_tokenize, word_tokenize
pd.set_option('display.max_colwidth', None)

In [2]:
def listPaths(path):
    pathfiles = list()
    for pathfile in glob.glob(path):
        pathfiles.append(pathfile)
    return pathfiles

def read_content(pathfile,num_sent=10):
    """
    Input: Path of txt file
    Output: A dictionary has keys 'original' and 'summary'
    """
    with open(pathfile, encoding="utf-8") as f:
        rows  = f.readlines()
        original = ' '.join(''.join(rows[4:]).split('\n'))

        summary = ' '.join(rows[2].split('\n'))
    original = ' '.join(sent_tokenize(word_tokenize(original,format='text'))[:num_sent])
    summary = ' '.join(sent_tokenize(word_tokenize(summary,format='text'))[:num_sent])
    return {'file' : pathfile,
            'original': original, 
            'summary': summary}

def get_dataframe(pathfiles):
    data = []
    for file in pathfiles:
        data.append(read_content(file))
    df = pd.DataFrame(data)
    df.dropna(inplace=True)
    df = df.sample(frac=1).reset_index(drop=True)
    return df

In [3]:
#make train data
paths_train = listPaths('./train_tokenized/*')
df_train = get_dataframe(paths_train)
pd.DataFrame.to_csv(df_train,'train_data.csv',index=False)


In [4]:
#make val data
paths_val = listPaths('./val_tokenized/*')
df_val = get_dataframe(paths_val)
pd.DataFrame.to_csv(df_val,'val_data.csv',index=False)


In [5]:
#make test data
paths_test = listPaths('./test_tokenized/*')
df_test = get_dataframe(paths_test)
pd.DataFrame.to_csv(df_test,'test_data.csv',index=False)

In [6]:
train = pd.read_csv('train_data.csv')
val = pd.read_csv('val_data.csv')
test = pd.read_csv('test_data.csv')

In [7]:
train.head()

Unnamed: 0,file,original,summary
0,./train_tokenized\067383.txt.seg,"Ngày 21/3 , ban_chấp_hành ( BCH ) Đoàn_thanh_niên cơ_quan Trung_ương_Hội Luật_gia Việt_Nam_phối_hợp với viện Huyết_học và Truyền_Máu Trung_ương tổ_chức buổi hiến máu tình_nguyện . Đây là hoạt_động nhằm hướng tới kỷ_niệm ngày thành_lập đoàn Thanh_niên_cộng_sản Hồ_Chí_Minh ( 26/3 ) . Chương_trình mang ý_nghĩa nhân_văn nhằm chia_sẻ vì cộng_đồng , góp_phần bổ_sung máu cho nhiều bệnh_nhân đang cần . Vì_thế , ngay từ khi phát_động , BCH_đoàn đã nhận được sự hưởng_ứng tham_gia tích_cực của đông_đảo cán_bộ , đoàn_viên thanh_niên . Có nhiều cán_bộ đã tham_gia hiến máu hàng chục lần , cũng có cán_bộ mới tham_gia lần đầu . Nhưng , tất_cả đều mong_muốn được quay trở_lại_viện huyết_học thêm nhiều lần nữa để trao đi những giọt_máu của mình , có_thể cứu sống những mảnh đời đang cần máu . Là đoàn_viên thanh_niên của chi_đoàn báo Đời_sống và Pháp_luật ( cơ_sở đoàn trực_thuộc Đoàn_thanh_niên cơ_quan TW HLG_Việt_Nam ) , anh Trương_Công_Hiếu_cho_biết : “ Đây là lần đầu_tiên tôi đi hiến máu và cảm_thấy hơi hồi_hộp . Qua lần hiến máu này , tôi thấy rằng mỗi bạn trẻ nên đi hiến máu một lần hoặc có_thể nhiều hơn_nữa để vừa giúp_ích cho mình và vừa giúp_ích cho cộng_đồng ” . Tuy_nhiên , có những đoàn_viên thanh_niên dù rất háo_hức đi hiến máu , nhưng không đủ tiêu_chuẩn và điều_kiện để tham_gia hiến máu . Dù_vậy , họ vẫn hy_vọng , mong_muốn một ngày nào đó không xa sẽ đủ điều_kiện hiến máu .","Với tinh_thần “ một giọt máu trao đi , một cuộc_đời ở lại ” , các cán_bộ , đoàn_viên_thanh_niên của cơ_quan Trung_ương_Hội Luật_gia ( TW_HLG ) Việt_Nam đã tham_gia hiến máu tình_nguyện ."
1,./train_tokenized\004622.txt.seg,"Mới_đây , Cơ_quan_CSĐT - Công_an tỉnh Hoà_Bình vừa ra_Lệnh cấm đi khỏi nơi cư_trú đối_với bác_sĩ_Hoàng_Công_Lương ( SN 1986 , trú tại xã Sủ_Ngòi , TP. Hoà_Bình , tỉnh Hoà_Bình ) do có liên_quan đến vụ án chạy thận làm 9 người chết tại Bệnh_viện đa_khoa tỉnh Hoà_Bình . Trong Lệnh_cấm đi khỏi nơi cư_trú áp_dụng đối_với bác_sĩ Hoàng_Công_Lương ghi rõ "" Giao_bị_can cho UBND xã Sủ_Ngòi_quản_lý , theo_dõi . Nếu đi khỏi nơi cư_trú mà chưa được sự đồng_ý của chính_quyền nơi bị_can_cư_trú hoặc đơn_vị quân_đội đang quản_lý_bị_can và chưa có giấy_phép của cơ_quan điều_tra đã ra_lệnh này thì bị_can_Lương sẽ bị tạm giam theo quy_định . Liên_quan đến sự_việc này , luật_sư_Hoàng_Ngọc_Biên ( luật_sư bào_chữa cho bác_sĩ Hoàng_Công_Lương ) cho_biết : Biện_pháp cấm đi khỏi nơi cư_trú là một trong những biện_pháp ngăn_chặn nhẹ nhất được quy_định trong BLTTHS năm 2015 ; các biện_pháp ngăn_chặn nặng hơn là tạm giữ , tạm giam , bảo_lĩnh ... Mục_đích của biện_pháp này là để hạn_chế một_số quyền_công_dân liên_quan đến việc đi_lại . Nếu bác_sĩ_Lương ra khỏi địa_phương thì phải xin phép đơn_vị ra_lệnh cấm trên . Cụ_thể , tại Điều 123 , BLTTHS năm 2015 quy_định : "" Cấm đi khỏi nơi cư_trú là biện_pháp ngăn_chặn có_thể áp_dụng đối_với bị_can , bị_cáo có nơi cư_trú , lý_lịch rõ_ràng nhằm bảo_đảm sự có_mặt của họ theo giấy triệu_tập của Cơ_quan_điều_tra , Viện_kiểm_sát , Toà_án "" . Theo luật_sư_Biên , việc cơ_quan CSĐT_ra_lệnh cấm đi khỏi nơi cư_trú đối_với bác_sĩ_Lương là không sai . Quyết_định này nhằm đảm_bảo cho công_tác điều_tra diễn ra theo đúng thời_gian_luật_định , đề_phòng trường_hợp triệu_tập bác_sĩ_Lương mà không có có_mặt tại địa_phương thì sẽ ảnh_hưởng tới hoạt_động của cơ_quan điều_tra . Ngoài lý_do nêu trên , luật_sư_Biên cho rằng , cũng chính vì bác_sĩ Hoàng_Công_Lương có nhân_thân tốt , nơi cư_trú_rõ_ràng nên được cơ_quan CSĐT áp_dụng biện_pháp nhẹ nhất là cấm đi khỏi nơi cư_trú . Đây là hoạt_động bình_thường trong hoạt_động tố_tụng .",Luật_sư bào_chữa cho bác_sĩ_Hoàng_Công_Lương trong vụ án chạy thận làm 9 người chết tại bệnh_viện Đa_khoa tỉnh Hoà_Bình_cho_biết lý_do vì_sao cơ_quan CSĐT tiếp_tục ra_lệnh cấm đi khỏi nơi cư_trú đối_với bị_can này .
2,./train_tokenized\006899.txt.seg,"Cười xuyên Việt là một trong những chương_trình hài_chất_lượng với những tiểu_phẩm tạo được hiệu_ứng mạnh_mẽ với khán_giả màn_ảnh nhỏ và cư_dân_mạng xã_hội . Chương_trình nhằm tìm_kiếm những tài_năng mới trong lĩnh_vực nghệ_thuật hài , góp_phần tạo nên một sân_chơi chuyên_nghiệp , mở ra cơ_hội để những diễn_viên trẻ thể_hiện_tài_năng của mình , mang những tiếng cười ý_nghĩa cho khán_giả truyền_hình . Bên_cạnh Việt_Hương , chương_trình còn có sự tham_gia của các nghệ_sĩ_gạo_cội trong làng giải_trí_Việt_Nam như NSND_Hồng_Vân , Vân_Sơn , Trung_Dân ... trong vai_trò giám_khảo luân_phiên . Tổng_giải_thưởng của chương_trình lên đến gần 1 tỷ đồng . Cười xuyên Việt 2017 cũng sẽ có nhiều đổi_mới . Thay_vì chỉ có một bảng thi như mọi năm , năm nay , chương_trình sẽ có 2 bảng dành cho 2 đối_tượng thí_sinh khác nhau , đó là bảng Tài_năng và bảng_Triển_vọng . Mỗi bảng sẽ có 1 Quán_quân . Bảng_Tài_năng dành cho các thí_sinh đã có thời_gian_hoạt_động trong nghề , tham_gia diễn_xuất nhiều chương_trình và được khán_giả biết đến . Bảng Tài_năng_bao_gồm các thí_sinh đã vượt qua sòng sơ_tuyển trước đó là : Minh_Xuân , Mộc_Trà , Hồng_Thanh , Phạm_Hy , Bá_Đức , Phi_Nguyễn , Lâm_Thắng và Minh_Dự . Bảng Triển_vọng gồm 8 thí_sinh có năng_khiếu diễn_xuất , hài_hước nhưng ít có cơ_hội hoặc chưa từng được tiếp_xúc với sân_khấu chuyên_nghiệp như : Võ_Tấn_Phát , Tuấn_Anh , Chí_Hào , Bảo_Châu , Hoàng_Phúc , Phương_Thảo , Xuân_Phú và Duy_Long .","Danh_hài Việt_Hương sẽ giữ vai_trò giám_khảo xuyên suốt chương_trình Cười xuyên Việt 2017 . Ngoài_ra , NSND_Hồng_Vân , Vân_Sơn , Trung_Dân ... sẽ đảm_nhận vị_trí giám_khảo luân_phiên ."
3,./train_tokenized\008750.txt.seg,"Thách_thức danh_hài mùa 3 kết_thúc với chiến_thắng thuộc về “ hot boy trà sữa ” Tấn_Lợi với phần tiểu_phẩm được nhiều khán_giả cho_rằng … không_thể cười nổi . Lập_tức_tân quán_quân cùng giám_khảo Trấn_Thành trở_thành tâm_điểm tranh_cãi . Hết phẫn_nộ thí_sinh “ hot boy trà sữa ” giả_tạo , diễn sâu , khán_giả lại quay sang trách_móc Trấn_Thành cười quá dễ_dãi . Có_thể thấy , chiến_thắng của chàng_trai Long_An trong suốt 5 vòng thi_hoàn_toàn nhờ vào Trấn_Thành . Ông xã Hari_Won_cười ngon_lành trước phần thi_ngô_nghê đã sử_dụng qua nhiều vòng_đấu của Tấn_Lợi . Trái_ngược với biểu_cảm của Trấn_Thành , giám_khảo Trường_Giang lại gần_như_vô_cảm với phần thi của Tấn_Lợi , thậm_chí “ Mười_khó ” còn thẳng_thắn khuyên “ hot boy trà sữa ” sau chiến_thắng này đừng đi diễn_hài . Trước áp_lực và những chỉ_trích_gay_gắt của dư_luận , Trấn_Thành đã lên_tiếng nhận lỗi . Trên trang cá_nhân , giám_khảo Thách_thức danh_hài viết : “ Mình sai rồi ! Có những điều không biết phải giãi_bày thế_nào !_Thôi_thì … haiz ” . Dòng trạng_thái được đăng_tải ở thời_điểm nhạy_cảm đã thu_hút sự quan_tâm_đặc_biệt từ công_chúng .","Giữa “ bão ” bị chỉ_trích vì cười dễ_dãi với quán_quân Thách_thức_danh_hài , giám_khảo Trấn_Thành đã lên_tiếng ."
4,./train_tokenized\027242.txt.seg,"Truyền_thông Nhật_cho_biết tại cuộc họp_báo_hôm_qua ( 18-4 ) , ông Junichi_Fukuda , 58 tuổi , đã khẳng_định rằng các cáo_buộc chống lại ông là "" sai sự_thật "" . Tuy_nhiên , đơn xin từ_chức của ông đã được Bộ_trưởng_Tài_chính Nhật_Taro_Aso_chấp_nhận cùng ngày . Theo lời vị quan_chức 58 tuổi , ông từ_chức vì cảm_thấy khó_khăn khi tiếp_tục làm_việc . Trước đó 2 ngày , ông Fukuda_dọa sẽ kiện tạp_chí_Shukan_Shincho . Ngày 18-4 , ông cũng tuyên_bố sẽ đưa vấn_đề này ra tòa . Ông Fukuda nói rằng ông quyết_định từ_chức vì "" ngay bây_giờ Bộ Tài_chính_Nhật đang trải qua giai_đoạn khó_khăn "" . "" Tôi cho_rằng việc tiếp_tục hoàn_thành nhiệm_vụ của tôi sẽ vô_cùng khó_khăn . Tôi gửi lời xin_lỗi tới những_ai mà tôi đã gây phiền_phức "" thứ_trưởng Bộ Tài_chính Nhật_Junichi_Fukuda_giải_thích cho việc từ_chức . Các cáo_buộc về việc ông Fukuda có những lời_lẽ khơi_gợi tình_dục đối_với các nữ phóng_viên lần đầu_tiên được tường_thuật bởi tuần_san_Shukan_Shincho của Nhật hồi đầu tuần trước . Tạp_chí này dẫn lời một_số nữ phóng_viên giấu tên nói rằng vị quan_chức 58 tuổi đã liên_tục "" rủ_rê "" họ quan_hệ_tình_dục với ông tại các cuộc gặp và tại quán bar .",Thứ_trưởng Bộ Tài_chính_Nhật_Junichi_Fukuda ngày 18-4 đã tuyên_bố_từ_chức giữa vòng xoáy cáo_buộc nói rằng ông quấy_rối tình_dục một_số nữ phóng_viên .


In [8]:
val.head()

Unnamed: 0,file,original,summary
0,./val_tokenized\011367.txt.seg,"Tổng_thống Mỹ_Trump ngồi trên xe , rời hoàng_cung ở Tokyo trong chuyến công_du Nhật hồi tháng 5 . JP Ward & Sons là công_ty dịch_vụ tang_lễ có trụ_sở tại Wicklow , Ireland cho thuê limousine để phục_vụ khách_hàng đến dự_đám_tang và những người muốn đi xe sang_trọng . Nhà_Trắng đã trả cho công_ty này 935.033 USD để sử_dụng 4 chiếc xe trong chuyến thăm Ireland của Tổng_thống_Trump . Công_ty_quảng_cáo rằng họ đã đầu_tư rất nhiều xe tang_hiện_đại và limousine sang_trọng . "" Tiện_nghi và an_toàn của bạn là ưu_tiên số_một của chúng_tôi . Tất_cả xe của chúng_tôi được điều_khiển bởi các lái_xe chuyên_nghiệp , cẩn_thận và mặc đồng_phục chỉn_chu "" , công_ty cho_biết . Xe của JP_Ward & Sons từng được thuê để đưa_đón bà Michelle_Obama cùng hai con_gái Sasha và Malia tại Ireland trong ba ngày vào năm 2013 . Họ được trả 114.000 USD vào dịp đó . Ông Trump đến Ireland vào ngày 5/6 sau khi kết_thúc chuyến thăm_Anh ba ngày . Ông sẽ gặp Thủ_tướng_Ireland_Leo_Varadkar trước khi đến khu nghỉ_mát của mình ở Doonbeg , Clare .",Nhà_Trắng chi gần một triệu USD để thuê 4 chiếc limousine nhằm phục_vụ cho chuyến công_du_Ireland của Trump .
1,./val_tokenized\000043.txt.seg,"Thông_tin trên báo Giao_Thông , vụ_việc xảy ra vào tối_ngày 24/11 . Theo lãnh_đạo Công_an xã Hoàng_Ninh , nạn_nhân là N.T . Q. A ( 18 tuổi ) , trú tại huyện Hiệp_Hoà . Cô_gái chết trong tư_thế treo_cổ . Nhận tin báo , lực_lượng chức_năng đã có_mặt tại hiện_trường , tiến_hành khám_nghiệm tử_thi , khám_nghiệm hiện_trường , điều_tra nguyên_nhân vụ_việc . Tại hiện_trường , cơ_quan_chức_năng bước_đầu xác_định cô_gái 18 tuổi tự_tử do nhận_thấy không có dấu_hiệu vụ án_mạng . Vì_thế , sau khi hoàn_tất các thủ_tục pháp_lý , cơ_quan công_an đã bàn_giao thi_thể nạn_nhân cho người_nhà đưa về quê lo hậu_sự . VTC_News đưa tin , kết_quả điều_tra ban_đầu cho thấy , Q. A_sống tại huyện Hiệp_Hoà và mới kết_hôn với anh Nguyễn_Văn_Đ. ( 27 tuổi , trú tại huyện Tân_Yên , Bắc_Giang ) cách đây 1 tuần . Cả 2 đều là công_nhân nên để tiện đường đi làm đã chuyển đến thôn Mỵ_Điền thuê trọ .","Người_dân bàng_hoàng phát_hiện cô_dâu mới cưới tử_vong trong tư_thế treo_cổ tại ngôi nhà ở thôn Mỵ_Điền , xã Hoàng_Ninh , huyện Việt_Yên ( Bắc_Giang ) ."
2,./val_tokenized\000022.txt.seg,"Ngày 12/4 , TAND tỉnh Đắk_Lắk đã mở phiên_toà sơ_thẩm xét_xử đối_với bị_cáo Y_Tuấn_KSơr ( SN 2001 , buôn_Sứk , xã Ea_Đar , huyện Ea_Kar , tỉnh Đắk_Lắk ) về tội Giết người . Theo cáo_trạng , vào_khoảng 15 h30 ngày 5/11/2018 , anh Lương_Văn_Quyết ( SN 1988 ) điều_khiển xe_máy chở Y_Tuấn_KSơr và anh Y_Xưa_Mlô ( SN 1994 ) theo hướng từ xã Ea_Sar đến Buôn_Sứk . Trên đường đi , Y_Tuấn_KSơr mua một cái liềm nhằm mục_đích đưa về gia_đình cho người_nhà cắt cỏ . Khi đi qua trạm thu phí cầu_treo thuộc địa_phận thôn 12 ( xã Ea_Đar ) thì anh Quyết không trả chịu trả tiền phí qua cầu và đi qua khoảng 10 m thì xe hết xăng . Lúc này , Y_Tuấn_KSơr đến nói_chuyện với ông Thái_Văn_Khoát ( SN 1958 , là người thu phí qua cầu_treo ) , thì gặp anh Phạm_Đình_Q . ( SN 1990 ) và anh Phạm_Đình_Hiếu ( SN 1997 ) cũng đang đứng tại đây . Lúc này , giữa anh Q. và Y_Tuấn_KSơr xảy ra mâu_thuẫn_cự cãi nhau . Sau khi trả tiền qua cầu cho ông Khoát , cả nhóm đẩy xe_máy đến tiệm tạp_hoá để mua xăng . Tuy_nhiên , anh Q. và anh Hiếu chạy xe_máy_đuổi theo nhóm Y_Tuấn_KSơr . Anh Q. cầm theo một khúc gỗ xông vào đánh anh Quyết và Y_Tuấn_KSơr .","Bị Q. dùng gậy đánh , Y_Tuấn đã dùng liềm chống_trả lạ , i khiến đối_thủ tử_vong"
3,./val_tokenized\016320.txt.seg,"Chia_sẻ của thầy_giáo_Phạm_Văn_Chiểu ( Trường THPT Nguyễn_Hữu_Cầu ) tại buổi họp_mặt_giao_lưu với các nhà_giáo_ưu_tú khiến nhiều người lặng đi . Thầy Chiểu xúc_động : "" Danh_hiệu_hôm_nay của tôi chứng_minh một điều , chỉ cần nhà_giáo sống và làm_việc có lương_tâm , cống_hiến hết_mình vì sự_nghiệp giáo_dục thì uy_tín của nhà_giáo sẽ còn đó , vẫn được mọi người tôn_trọng "" . Theo thầy_Chiểu , trước các vấn_nạn hiện_nay , bản_thân mỗi người thầy phải tự_vấn xem mình đã làm đúng vị_trí người thầy , đúng đạo_đức nhà_giáo chưa ? "" Mặt_khác , nhà_giáo chúng_tôi cũng cần sự quan_tâm của cả xã_hội - không_chỉ để nâng_cao trình_độ chuyên_môn , mà_còn cần cả giải_pháp về kinh_tế , để chúng_tôi yên_tâm giảng_dạy "" , thầy bày_tỏ . Bà Nguyễn_Thị_Gái - Chủ_tịch Công_đoàn ngành GD-ĐT TP , nhấn_mạnh : "" Mỗi thầy_cô_giáo là một tấm gương về đạo_đức , tự học và sáng_tạo để học_sinh và xã_hội noi theo . Danh_hiệu_nhà_giáo_nhân_dân , nhà_giáo_ưu_tú không đơn_thuần chỉ là danh_hiệu cho một cá_nhân mà là sự ghi_nhận của toàn xã_hội . Họ chính là những người tiếp thêm lửa , niềm_tin để cán_bộ , nhân_viên , đặc_biệt là đội_ngũ giáo_viên trẻ có thêm sức_mạnh vượt qua khó_khăn , thử_thách "" . Buổi họp_mặt do Công_đoàn ngành GD-ĐT TP. HCM tổ_chức ngày 15-11 Nhân_Ngày_nhà_giáo Việt_Nam_20-11 . Thầy Phạm_Văn_Chiểu ( thứ hai từ trái sang ) tại buổi giao_lưu với các nhà_giáo_ưu_tú - Ảnh : P. H.NAM","' Bản_thân tôi từng có ý_định bỏ nghề 3 lần vì hoàn_cảnh quá khó_khăn , nhưng khi suy_nghĩ lại , tôi vẫn thấy thiếu một cái gì đó về tinh_thần ' ."
4,./val_tokenized\019468.txt.seg,"Sáng 6/11 , Trần_Quang_Tuấn ( 27 tuổi , quê Thái_Bình ) có biểu_hiện ngáo đá , trèo lên trụ đường_dây 220 kV ( cao khoảng 70 m ) ở phường Bình_Chuẩn , thị_xã_Thuận_An . Nhiều người_dân đã can_ngăn , nhưng Tuấn_tiếp_tục trèo lên tận ngọn trụ điện và liên_tục_la_hét , đòi nhảy xuống . Nam_thanh_niên cố_thủ nhiều giờ trên trụ điện cao_thế . Hàng chục cảnh_sát cứu_hộ yêu_cầu ngắt_điện , triển_khai bơm túi hơi , đồng_thời dùng loa vận_động thanh_niên này xuống nhưng bất_thành . Sau gần 3 giờ được thuyết_phục , Tuấn mới chịu trèo xuống . Theo cảnh_sát , Tuấn vừa chuyển đến sống cùng người_thân ngay cạnh trụ điện khoảng hai tháng nay . Anh ta có vợ_con nhưng đã ly_hôn . Vụ_việc đang được làm rõ . Hồi tháng 3 , nam_thanh_niên khác cũng cố_thủ 8 giờ trên trụ điện cao_thế ở thị_xã_Bến_Cát , Bình_Dương . Sự_cố gây mất điện trên diện rộng từ thị_xã_Bến_Cát và nhiều khu_vực ở tỉnh Tây_Ninh .","Nam thanh_niên_nghi ngáo đá trèo lên trụ điện cao_thế cao 70 m ở Bình_Dương liên_tục la_hét , cố_thủ nhiều giờ ."


In [9]:
test.head()

Unnamed: 0,file,original,summary
0,./test_tokenized\015623.txt.seg,"Ban_bí_thư Trung_ương Đoàn_đánh_giá 14 cá_nhân nhận kỷ_niệm_chương "" Vì thế_hệ trẻ "" là những người tiêu_biểu có đóng_góp cho công_tác Đoàn , Hội , Đội trong thời_gian vừa_qua . "" Vì thế_hệ trẻ "" là phần_thưởng cao_quý của Trung_ương Đoàn nhằm tri_ân những cá_nhân có đóng_góp xuất_sắc trong công_tác giáo_dục thế_hệ trẻ . Nhân_dịp này , Ban_bí_thư_Trung_ương Đoàn_gặp_mặt , chúc_mừng Bộ Giáo_dục và đào_tạo , các thầy , cô_giáo_nhân kỷ_niệm 35 năm Ngày nhà_giáo Việt_Nam . Chia_sẻ tại buổi gặp_mặt , bà Nguyễn_Thị_Nghĩa , thứ_trưởng Bộ Giáo_dục và đào_tạo , nhấn_mạnh Trung_ương Đoàn và Bộ Giáo_dục và đào_tạo đều có mục_tiêu chung là đào_tạo , định_hướng và rèn_luyện thanh_thiếu_nhi trở_thành những con_người có phẩm_chất đạo_đức , trình_độ tri_thức và kỹ_năng xã_hội , trở_thành công_dân tốt . Thứ_trưởng Nguyễn_Thị_Nghĩa ghi_nhận công_tác Đoàn , Hội , Đội trong trường_học hiện_nay góp_phần giáo_dục và rèn_luyện nền_nếp , kỷ_cương cho học_sinh , sinh_viên và trang_bị cho các em nhiều kỹ_năng_xã_hội , tạo môi_trường vui_chơi giải_trí lành_mạnh sau mỗi giờ học . Thay_mặt Ban_bí_thư_Trung_ương Đoàn , Bí_thư_Nguyễn_Long_Hải bày_tỏ mong_muốn trong thời_gian tới , Bộ_Giáo_dục và đào_tạo tiếp_tục tạo điều_kiện và hỗ_trợ tổ_chức Đoàn , Hội , Đội triển_khai các hoạt_động dành cho thanh_thiếu_nhi . Chiều cùng ngày , Bí_thư Trung_ương_Đoàn_Nguyễn_Long_Hải cũng đến thăm , chúc_mừng P_GS.TS KH_Nguyễn_Tuyết_Minh ( 79 tuổi ) , nguyên phó chủ_nhiệm khoa ngôn_ngữ và văn_hoá_Nga , Trường đại_học_Ngoại_ngữ , Đại_học Quốc_gia_Hà_Nội . Bà là người Việt_Nam_duy_nhất được nhận Huy_chương_Pushkin ( Nga ) năm 2017 . Anh Nguyễn_Long_Hải , bí_thư Trung_ương Đoàn , trao kỷ_niệm_chương "" Vì thế_hệ trẻ "" cho 14 cán_bộ làm công_tác giáo_dục tại Bộ Giáo_dục và đào_tạo - ẢNH : DƯƠNG_TRIỀU . Anh Nguyễn_Long_Hải , bí_thư Trung_ương Đoàn , tặng hoa cho Thứ_trưởng Bộ Giáo_dục và đào_tạo_Nguyễn_Thị_Nghĩa - ẢNH : DƯƠNG_TRIỀU .","Ban_bí_thư Trung_ương Đoàn đã quyết_định trao kỷ_niệm_chương "" Vì thế_hệ trẻ "" cho 14 cán_bộ đang công_tác tại Bộ Giáo_dục và đào_tạo_nhân kỷ_niệm 35 năm Ngày nhà_giáo Việt_Nam_20-11 ."
1,./test_tokenized\015428.txt.seg,"Chiều 23/2 , UBND tỉnh Nghệ_An đã tổ_chức chương_trình Gặp_mặt các nhà_đầu_tư Xuân_Kỷ_Hợi năm 2019 tại T X.Cửa_Lò , tỉnh Nghệ_An . Đây là lần thứ 11 , hội_nghị này được tổ_chức vào dịp đầu_Xuân năm mới . Tới dự_hội_nghị có Thủ_tướng Chính_phủ_Nguyễn_Xuân_Phúc ; cùng lãnh_đạo một_số cơ_quan_bộ , ban , ngành Trung_ương , địa_phương ; và gần 700 đại_biểu đến từ các tổ_chức , tập_đoàn , các tổng_công_ty , doanh_nghiệp , hiệp_hội_doanh_nghiệp , các nhà_đầu_tư trong và ngoài nước , các cơ_quan , tổ_chức quốc_tế tại Việt_Nam . Phát_biểu chào_mừng hội_nghị , Chủ_tịch UBND tỉnh Nghệ_An_Thái_Thanh_Quý_khẳng_định : “ Chính các nhà_đầu_tư đã góp_phần tạo nên động_lực phát_triển mạnh_mẽ cho Nghệ_An trong giai_đoạn vừa_qua . Đồng_thời , các nhà_đầu_tư cũng chính là thước_đo phản_ánh khách_quan nhất môi_trường đầu_tư của Nghệ_An , giúp tỉnh nhận_thấy rõ những gì mình đã làm được và chưa làm được cần phải thay_đổi ” . Giai_đoạn 2014 - 2018 , Nghệ_An đã thu_hút 690 dự_án đầu_tư với tổng_số vốn đăng_ký gần 143.000 tỷ đồng , trong đó : 650 dự_án đầu_tư trong nước , với hơn 133.500 tỷ đồng và 40 dự_án FDI với hơn 9.500 tỷ đồng . Chỉ tính riêng đối_với dự_án có tổng mức đầu_tư trên 100 tỷ đồng / dự_án , toàn tỉnh đã thu_hút 150 dự_án với tổng vốn đầu_tư 89.141 tỷ đồng . Thông_qua đầu_tư các dự_án đã đóng_góp tích_cực vào tăng_trưởng kinh_tế ( GRDP ) của tỉnh năm 2018 đạt 8,77 % ( cao nhất từ trước đến nay ) ; năm 2018 , thu ngân_sách đạt 13.937 tỷ đồng , đạt 109,8 % dự_toán và tăng 9,4 % so với thực_hiện năm 2017 ; GDP bình_quân đầu người đạt 38 triệu đồng ; giải_quyết việc_làm mới cho hơn 37.500_lao_động … Tại hội_nghị , Thủ_tướng_Nguyễn_Xuân_Phúc đã có bài phát_biểu quan_trọng , ghi_nhận những thành_tựu trong thu_hút đầu_tư , phát_triển kinh_tế - xã_hội của tỉnh . Thủ_tướng cho rằng , đây không_chỉ là buổi gặp_mặt các nhà_đầu_tư đầu Xuân_mà_còn là sự kết_nối_trái_tim giữa các thế_hệ , giữa các nhà_đầu_tư với tỉnh nhà_Nghệ_An . Thủ_tướng cũng chia_sẻ , tại chuyến công_tác lần này , ông có gặp người xứ Nghệ và nghe được một câu : “ Cầm_vàng còn sợ vàng rơi / Lấy con_trai Nghệ_Tĩnh cả đời ấm_no ” .","“ Mỗi khi gặp khó_khăn hay buồn_bực , các bạn hãy nhớ_điệu hò_xứ Nghệ : “ Anh ơi khoan vội bực_mình . Em xin kể lại phân_minh_tỏ_tường ” … ” , Thủ_tướng Nguyễn_Xuân_Phúc_chia_sẻ trong chương_trình Gặp_mặt các nhà_đầu_tư Xuân_Kỷ_Hợi năm 2019 ."
2,./test_tokenized\021672.txt.seg,"Trao_đổi với VnExpress , Kiến_trúc_sư_Ngô_Viết_Nam_Sơn cho biết , trên thế_giới người_ta thường lát đá granite hay một_số loại đá đắt tiền khác ở những khu_vực có hạ_tầng đã tương_đối_ổn_định , không có nhu_cầu đào lên , hoặc đập ra làm lại và đặc_biệt là ở những khu_vực có công_trình ngầm . "" Khi đó , đá granite được lát trên hệ_thống nắp , lúc có nhu_cầu sửa_chữa người_ta chỉ cần dỡ nắp lên , sau đó lấp lại , không gây hư_hại và rất thuận_tiện "" , ông Sơn nói và cho_rằng TP HCM đang phát_triển rất năng_động , tất_cả các khu_vực vẫn còn tăng_trưởng , mật_độ xây_dựng sẽ tăng cao nên nhu_cầu nâng_cấp , cải_tạo cơ_sở_hạ_tầng cần thực_hiện trước khi tính_chuyện lát đá "" sang "" ở vỉa_hè . Vỉa_hè đường Lê_Duẩn ( quận 1 ) đã được lát đá_hoa_cương_khang_trang , sạch_đẹp . "" Điều_kiện chưa cho_phép chúng_ta sử_dụng loại đá đắt tiền để xây trên vỉa_hè . Thậm_chí không cần lát bằng gạch mà có_thể sử_dụng ximăng , miễn_là xây_dựng đẹp . Khi nào cơ_sở_hạ_tầng hoàn_thiện , thành_phố hạn_chế tầm cao_xây_dựng lúc đó có_thể làm vỉa_hè bằng đá granite "" , ông Sơn nói . Theo ông Sơn , quận 1 nói rằng chi_phí làm vỉa_hè 1.000 tỷ đồng là do các doanh_nghiệp bỏ ra , quận sẽ trả_chậm trong 3-5 năm "" thì về bản_chất vẫn là tiền ngân_sách "" . "" Nếu tất_cả số tiền này do doanh_nghiệp họ tài_trợ thì quá tốt . Hiện , chúng_ta còn rất nhiều hạng_mục cần ưu_tiên hơn là đầu_tư xây_dựng vỉa_hè đắt_đỏ "" . Ông Sơn dẫn_chứng thêm : "" Như dự_án nâng_cấp , cải_tạo Bệnh_viện_Hùng_Vương xin ngân_sách 400 tỷ đồng nhưng suốt mấy năm nay chưa được thành_phố phê_duyệt .","Theo các chuyên_gia , việc đầu_tư cả nghìn tỷ đồng để lát đá granite vỉa_hè khu trung_tâm TP HCM là việc_làm không cần_thiết và rất lãng_phí ."
3,./test_tokenized\019177.txt.seg,"Ngày 17/2 , ông Cao_Thanh_Thương - Chủ_tịch UBND huyện Hoài_Nhơn ( Bình_Định ) cho_biết đã đề_nghị công_an huyện điều_tra_sự_việc vợ_chồng ông Lâm_Quang_Định ( 57 tuổi ) và bà Phan_Thị_Trí ( 51 tuổi ) ở xã Hoài_Phú_tử_vong . Người_dân kéo đến vườn chuối khi nghe tin vợ_chồng tử_vong ở hàng_rào thép gai . Chiều_qua , ông Định và bà Trí ra vườn chuối của gia_đình gần hồ Cự_Lễ để tưới chuối . Do không biết hàng_rào thép gai có điện , họ dùng tay nắm hàng_rào để đi qua thì bị giật . Cả hai được người_dân phát_hiện khi đã tử_vong , tay vẫn còn bám chặt vào hàng_rào thép . Quan_sát , người_dân phát_hiện phía dưới hàng_rào có đường điện ba pha bắt ngang qua , có đoạn nằm sát đất . Họ cho rằng đường_dây đã sử_dụng lâu ngày khiến điện bị rò_rỉ sang hàng_rào . Lãnh_đạo huyện cho_hay , trước_đây đường dây_điện ba pha được sử_dụng để thi_công hồ thuỷ_lợi_Cự_Lễ , công_trình đã hoàn_thành . Hiện có người thuê mặt_bằng làm cơ_sở_sấy mực đã tận_dụng đường dây_điện này . Người_dân kéo đến vườn chuối khi nghe tin vợ_chồng tử_vong ở hàng_rào thép gai .","Dùng tay nắm hàng_rào thép gai trên đường ra vườn chuối , cặp vợ_chồng ở Bình_Định bị điện giật do dây_điện ba pha rò_rỉ ."
4,./test_tokenized\003746.txt.seg,"Chiều nay 23-7 tại Hà_Nội , anh Lê_Quốc_Phong , Bí_thư_thứ_nhất_Trung_ương Đoàn , Chủ_nhiệm Uỷ_ban_quốc_gia về thanh_niên_Việt_Nam , đã có buổi gặp_gỡ với 50 đại_biểu thanh_niên Nga do ông Alexander_Bugayv , Chủ_tịch_Cơ_quan Liên_bang_Nga về Công_tác_thanh_niên , làm trưởng_đoàn . Cuộc gặp_gỡ nằm trong khuôn_khổ Diễn_đàn_thanh_niên Việt - Nga diễn ra từ ngày hôm_nay đến hết ngày 29-7 tại Hà_Nội , Quảng_Ninh , TP. HCM . Diễn_đàn nhằm góp_phần tăng_cường giáo_dục truyền_thống hữu_nghị Việt - Nga cho thanh_thiếu_niên hai nước , nâng_cao nhận_thức về mối quan_hệ hữu_nghị truyền_thống , đối_tác chiến_lược toàn_diện giữa hai nước Việt - Nga ... Anh Lê_Quốc_Phong bày_tỏ niềm vui_mừng được đón_tiếp đoàn thanh_niên Nga sang thăm Việt_Nam và khẳng_định tổ_chức Đoàn TNCS_Hồ_Chí_Minh , tuổi_trẻ Việt_Nam luôn cảm_thấy_gần_gũi , thân_thiết với các bạn Nga . "" Chúng_tôi cảm_thấy chính nền_tảng , quan_hệ_sâu_sắc giữa hai đất_nước tạo cơ_hội thuận_lợi cho thanh_niên hai nước giao_lưu , hợp_tác , hỗ_trợ nhau phát_triển "" , anh Phong_nhấn_mạnh . Dịp này , anh Lê_Quốc_Phong_điểm lại những điểm sáng trong công_tác Đoàn và phong_trào thanh_thiếu_nhi thời_gian qua , điểm lại ba phong_trào lớn của tổ_chức Đoàn , sự thành_công trong hợp_tác thanh_niên Việt - Nga như giao_lưu thanh_niên , thiếu_nhi hai nước . Anh Phong_khẳng_định việc ký_kết biên_bản hợp_tác giai_đoạn 2019 - 2022 lần này là bước_đi quan_trọng , mở ra nhiều cơ_hội mới trong hợp_tác giữa tổ_chức thanh_niên hai nước . Ông Alexander_Bugayevbày_tỏ niềm tự_hào bởi Nga có mối quan_hệ chặt_chẽ với Trung_ương Đoàn về công_tác thanh_niên . "" Ít có tổ_chức thanh_niên nào , dân_tộc nào có sự gắn_bó , truyền_thống_hữu_nghị với chúng_tôi như Việt_Nam , gắn_bó lâu_dài trong lịch_sử "" , ông Alexander nói . Trong khuôn_khổ gặp_gỡ , Uỷ_ban_quốc_gia về Thanh_niên_Việt_Nam và cơ_quan Liên_bang_Nga về công_tác thanh_niên ký_kết thoả_thuận hợp_tác giai_đoạn 2019 - 2022 với các nội_dung : giáo_dục thanh_thiếu_nhi hai nước về tình_hữu_nghị truyền_thống Việt - Nga , hàng năm Việt_Nam và Nga sẽ cử các đoàn đại_biểu cấp cao và các đoàn đại_biểu thanh_niên ( thông_qua việc tổ_chức Diễn_đàn_thanh_niên Việt - Nga tại mỗi nước ) , các đoàn đại_biểu thiếu_nhi , doanh_nhân trẻ , thanh_niên , sinh_viên tình_nguyện thăm và làm_việc với nhau . Ký_kết biên_bản_ghi_nhớ hợp_tác giai_đoạn 2019 - 2022 giữa Uỷ_ban_quốc_gia về thanh_niên_Việt_Nam và cơ_quan Liên_bang_Nga về Công_tác_thanh_niên - Ảnh : HÀ_THANH .","Anh Lê_Quốc_Phong , Bí_thư_thứ_nhất_Trung_ương Đoàn , nhấn_mạnh chính mối quan_hệ_tốt_đẹp giữa hai đất_nước Việt - Nga tạo điều_kiện thuận_lợi cho thanh_niên hai nước giao_lưu , hợp_tác , hỗ_trợ nhau phát_triển ."
