CSBinary – Bản port cho BinaryReader và BinaryWriter từ .NET Core sang NodeJS

(Click here to read the English version).

Giả sử bạn muốn viết chương trình đọc, trích xuất dữ liệu từ file nhị phân, chẳng hạn như archive file, file nén, v.v. và NodeJS có vẻ là nền tảng rất gọn nhẹ và tiện lợi để viết nhanh một chương trình làm như vậy. Nhưng đáng buồn thay, nền tảng NodeJS vốn được thiết kế chú trọng vào lập trình server, mang tính tối giản, có API ít ỏi so với những nền tảng khác. Không có nghĩa là NodeJS không có API để đọc file, nhưng để đọc được file nhị phân bằng NodeJS thì phải rất cực khổ bằng module fs như thế này:

// đọc một byte, hai byte và bốn byte
const fs = require('fs');

const fd = fs.openSync('<đặt đường dẫn file vào đây>', 'r');
const buffer = Buffer.alloc(4);

fs.readSync(fd, buffer, 0, 1);
console.log(buffer.readUInt8());
fs.readSync(fd, buffer, 0, 2);
console.log(buffer.readUInt16LE());
fs.readSync(fd, buffer, 0, 4);
console.log(buffer.readUInt32LE());

fs.closeSync(fd);

Module đấy không có sẵn các hàm đọc cụ thể kiểu dữ liệu nào từ file cả mà chỉ có hàm đọc/ghi làm việc với kiểu Buffer (tương đương kiểu array trong các ngôn ngữ khác). Và chưa kể module fs của NodeJS không thực sự có chức năng "seek" riêng lẻ, bạn phải tự bảo quản một biến vị trí riêng để làm tham số cho các hàm đọc/ghi nếu bạn muốn đọc/ghi ở vị trí bất kỳ trong tập tin, và vì NodeJS thiên về server nên nó không hề có cơ chế file buffering dựng sẵn. Thử nghĩ nếu dùng NodeJS để đọc/ghi tập tin nhị phân có cấu trúc rất phức tạp và phi tuyến tính thì code sẽ dài dòng như thế nào?

Thư viện này là bản port của 2 API rất tiện lợi cho việc đọc/ghi tập tin nhị phân từ .NET Core. Bằng thư viện này, code trở nên ngắn gọn và dễ hiểu hơn, bạn có thể xem thêm phần ví dụ bên dưới để biết thêm chi tiết.

// đọc một byte, hai byte và bốn byte
const fs = require('fs');
const { BinaryReader, File } = require('csbinary');

const file = File(fs.openSync('<đặt đường dẫn file vào đây>', 'r'));
const reader = new BinaryReader(file);

console.log(reader.readUInt8());
console.log(reader.readUInt16());
console.log(reader.readUInt32());

reader.close();

Tính năng

Hỗ trợ phương thức "seek" để đưa con trỏ file tới bất kỳ vị trí nào trong tập tin, lập trình viên không cần bảo quản biến vị trí nào cả. Cùng với phương thức "tell" để biết con trỏ file đang ở đâu.

Có các phương thức để đọc/ghi nhanh và ngắn gọn nhiều kiểu dữ liệu như Integer (1 byte, 2 byte, 4 byte, 8 byte), Float, Double, Char, String (null-terminated, length-prefix)

Mặc định có chức năng file buffering.

Đọc/ghi chuỗi văn bản ở nhiều encoding khác nhau với khả năng từ thư viện iconv-lite dựng sẵn trong thư viện.

Cài đặt

npm i --save csbinary

Kể từ version 2.1.0, thư viện này sử dụng native module build sẵn ở kiến trúc IA-32 và x86-64 cho Windows, Linux-based OS và MacOS. Nếu bạn sử dụng những hệ thống này thì không cần phải cài trình biên dịch C/C++.

Tuy nhiên nếu bạn sử dụng hệ thống khác với các hệ thống kể trên thì bạn cần toolchain trình biên dịch C/C++ để có thể cài đặt gói thư viện này. Xem node-gyp repository để biết cách cài đặt toolchain trình biên dịch cho hệ thống mà bạn dùng.

Tham khảo API

Xin ghé xem CSBinary API Reference (Tiếng Anh).

Ví dụ

Xin xem tại Trang Ví dụ.

Encoding và File

Mặc định thì thư viện này sử dụng iconv-lite làm hệ thống encoding nội bộ. Bạn có thể đưa encoding của chính bạn vào bằng cách "thực hiện" giao diện IEncoding, rồi đưa encoding instance của bạn vào constructor của BinaryReader và BinaryWriter. Xin hãy xem file encoding.ts để biết cần phải thực hiện cái gì.

Tương tự vậy, bạn có thể dùng bản thực hiện của riêng mình cho IFile. Xin hãy xem file addon/file.ts để biết cần phải thực hiện những thứ gì.

Hạn chế

Thư viện này không thể thực thi thao tác nhập/xuất bất đồng bộ.

Không hỗ trợ Mô thức Dispose và kiểu dữ liệu Decimal, do những thứ này không tồn tại mặc định trong bất kỳ engine Javascript nào.

Thư viện không có tối ưu hóa cho việc viết chuỗi văn bản quá dài trong BinaryWriter, cho nên để tránh chuyện cấp phát bộ nhớ quá to thì bạn đừng nên viết chuỗi dài quá.

Hai phương thức writeChars với writeCharsEx đều sẽ nối các ký tự trong mảng lại trước khi ghi file, trên hệ thống của bạn có thể chậm;

Pitfalls

Nếu bạn tính dùng chung file descriptor cho BinaryReader và BinaryWriter, thì bạn cũng hãy nên dùng chung IFile instance cho 2 class đó. Dùng khác IFile instance thì sẽ khiến cho kết quả sinh ra không thể lường được:

const fs = require('fs');
const { BinaryReader, BinaryWriter, File } = require('csbinary');
const fd = fs.openSync(filePath, 'rw');
// viết thế này là sai
const reader = new BinaryReader(File(fd), 'utf8', true);
const writer = new BinaryWriter(File(fd));
// ***
reader.close();
writer.close();

Xin hãy dùng chung IFile instance cho chúng:

const fs = require('fs');
const { BinaryReader, BinaryWriter, File } = require('csbinary');
const fd = fs.openSync(filePath, 'rw');
// viết thế này mới là đúng
const file = File(fd);
const reader = new BinaryReader(file, 'utf8', true);
const writer = new BinaryWriter(file);
// ***
reader.close();
writer.close();

Nếu trong khi đang sử dụng BinaryReader/BinaryWriter mà bạn điều chỉnh vị trí của con trỏ file bên dưới một cách trực tiếp (bằng hàm của module fs chẳng hạn), thì sẽ dễ sinh ra lỗi không biết trước được. Thay vào đó, hãy sử dụng phương thức seek của IFile. Nhưng nếu bạn dùng phương thức disable file buffering thì không sao.

const fs = require('fs');
const { BinaryReader, BinaryWriter, File, SeekOrigin } = require('csbinary');
const fd = fs.openSync(filePath, 'rw');
const file = File(fd);
const reader = new BinaryReader(file, 'utf8', true);
// nếu chưa tắt dùng file buffering thì đừng làm thế này
fs.readSync(fd, buffer, 0, 2, 4); // và cũng đừng làm điều gì khác mà có thay đổi vị trí con trỏ file
// thay vào đó thì nên ghi thế này
reader.file.seek(4, SeekOrigin.Begin);
reader.file.read(buffer, 0, 2);

reader.close();

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_VI.md

README_VI.md

CSBinary – Bản port cho BinaryReader và BinaryWriter từ .NET Core sang NodeJS

Tính năng

Cài đặt

Tham khảo API

Ví dụ

Encoding và File

Hạn chế

Pitfalls

Files

README_VI.md

Latest commit

History

README_VI.md

File metadata and controls

CSBinary – Bản port cho BinaryReader và BinaryWriter từ .NET Core sang NodeJS

Tính năng

Cài đặt

Tham khảo API

Ví dụ

Encoding và File

Hạn chế

Pitfalls