# คอลเลกชัน

คอลเลกชัน (collection) หรือข้อมูลชนิดรวมหมู่เป็นชนิดของข้อมูลประเภทหนึ่งที่ใช้เพื่อเก็บข้อมูลชนิดอื่น ๆ หลาย ๆ จำนวนไว้ด้วยกัน ในบทนี้เราจะมาศึกษาข้อมูลชนิดอาร์เรย์ คลาส `ArrayList` สตริง อีนัม และคลาส `HashMap` นอกจากนี้เราจะศึกษาการวนซ้ำบนคอลเลกชันด้วย

## อาร์เรย์

อาร์เรย์ (array) หรือแถวลำดับเป็นชนิดข้อมูลที่ใช้จัดเก็บข้อมูลชนิดอื่นแบบเป็นลำดับ โดยสามารถใช้ดัชนี (index) เป็นตัวระบุตำแหน่งเพื่อเข้าถึงข้อมูลตำแหน่งใด ๆ ก็ได้ในทันที

### การประกาศและสร้างอาร์เรย์

การประกาศตัวแปรให้เป็นชนิดอาร์เรย์จะต้องระบุว่าเป็นอาร์เรย์ของข้อมูลชนิดใด และใช้รูปแบบการประกาศดังนี้

```
type[] varName;
```

วงเล็บก้ามปูสามารถไว้ท้ายชื่อชนิดหรือท้ายชื่อตัวแปรก็ได้ เพราะฉะนั้นรูปแบบการประกาศแบบนี้ก็ถือว่าถูกต้องเช่นกัน

```
type varName[];
```

เช่น

In [None]:
int[] ranks;
String[] messages;
double scores[];

รูปแบบหลังนี้เป็นแบบที่รับมาจากภาษา C แต่เป็นรูปแบบที่ไม่นิยมและไม่แนะนำให้ใช้

ตัวแปรอาร์เรย์ที่เราประกาศแล้วแต่ยังไม่กำหนดค่าตั้งต้นให้จะมีค่าเป็น `null` ซึ่งหมายถึงตัวแปรอาร์เรย์นี้ยังไม่ได้อ้างอิงอาร์เรย์ใด ๆ เป็นเพียงตัวแปร แต่ยังไม่มีตัวอาร์เรย์

เราสามารถสร้างอาร์เรย์และกำหนดค่าตั้งต้นให้กับตัวแปรอาร์เรย์ได้หลายวิธีดังนี้

In [10]:
int[] ranks = new int[10];
double[] scores = { 1.25, 2.5, 5.0, 6.25, 7.5 };
String[] messages = new String[] { "Hello", "this", "is", "a", "message" };
double[] distances;
distances = new double[] { 425.23, 771.94, 23.56, 1_038.77 };

แบบแรกเป็นการประกาศตัวแปรอาร์เรย์ `ranks` แล้วกำหนดค่าตั้งต้นให้โดยการใช้คำสั่ง `new` สร้างอาร์เรย์ของชนิด `int` ขนาด 10 สมาชิกโดยไม่ระบุค่าตั้งต้นให้กับสมาชิกแต่ละตัว

การไม่กำหนดค่าตั้งต้นให้กับสมาชิกของอาร์เรย์จะทำให้สมาชิกแต่ละตัวมีค่าตั้งต้นโดยปริยายโดยอัตโนมัติ ซึ่งถ้ามีชนิดเป็นตัวเลขหรือ `char` ก็จะมีค่าเป็น 0 หรือ 0.0 ถ้าเป็น `boolean` ก็จะมีค่าเป็น false และถ้าเป็นข้อมูลชนิดตัวอ้างอิงก็จะมีค่าเป็น `null`

แบบถัดมา `scores` ถูกประกาศพร้อมกับกำหนดให้เป็นอาร์เรย์ของ `double` ที่มีข้อมูลเป็น 1.25, 2.5, 5.0, 6.25, 7.5 ตามลำดับ ขนาดของอาร์เรย์จะเป็น 5 สมาชิกโดยอัตโนมัติ

ตัวแปรอาร์เรย์ `messages` ก็เช่นกัน ถูกกำหนดให้มีค่าตั้งต้นเป็น `"Hello"`, `"this"`, `"is"`, `"a"`, `"message"` ซึ่งมีขนาดเป็น 5 สมาชิก การกำหนดค่าเริ่มต้นแบบนี้คล้ายกับแบบของ `scores` แต่เราใช้คำสั่ง `new` ในการสร้างอาร์เรย์

รูปแบบที่ใช้กับการกำหนดค่าเริ่มต้นของ `messages` อาจจะดูยาวกว่าแบบที่ใช้กับ `scores` แต่มีข้อดีคือสามารถใช้สร้างอาร์เรย์พร้อมกำหนดค่าตั้งต้นให้กับสมาชิกอาร์เรย์ที่ใดก็ได้ ไม่จำเป็นต้องใช้เฉพาะเวลาประกาศตัวแปรเหมือนอย่างแบบที่ใช้กับ `scores`

เราเห็นตัวอย่างได้จาก `distances` ซึ่งตอนประกาศเราไม่ได้สร้างอาร์เรย์ขึ้นมาด้วย แต่มาสร้างและกำหนดให้ทีหลังในบรรทัดต่อไปโดยใช้รูปแบบเดียวกับที่กับ `messages` การกำหนดค่าเริ่มต้นแบบที่ใช้กับ `scores` ไม่สามารถใช้ในกรณีนี้ได้

อาร์เรย์ที่สร้างขึ้นมาแล้วไม่สามารถเปลี่ยนขนาดได้นอกจากจะสร้างอาร์เรย์ใหม่ให้มีขนาดใหม่ที่ต้องการแล้วย้ายข้อมูลจากอาร์เรย์เดิมไป

### การเข้าถึงอาร์เรย์

เราสามารถเข้าถึงสมาชิกแต่ละตัวในอาร์เรย์ได้โดยใช้รูปแบบ `varName[i]` โดยจะเป็นตัวระบุตำแหน่งสมาชิก สมาชิกตัวแรกจะเริ่มต้นที่ตำแหน่ง 0

เราสามารถรู้ขนาดของอาร์เรย์ได้โดยการอ้างอิงคุณสมบัติ `length` ของอาร์เรย์นั้นในรูป `varName.length` ตำแหน่งของสมาชิกจะเริ่มจาก 0 ไปสิ้นสุดที่ `length` - 1

ตัวอย่างต่อไปนี้เป็นการหาผลบวกสะสมของลำดับตัวเลข โดยเก็บค่าผลลัพธ์กลับลงไปในอาร์เรย์ตัวเดิมเลย

In [15]:
// In-place cumulative sum
double[] values = { 1.0, 3.5, 2.0, 1.5, 5.5, 3.0 };
double sum = 0.0;

for (int i = 0; i < values.length; i++) {
    sum += values[i];
    values[i] = sum;
}

System.out.println(Arrays.toString(values));

[1.0, 4.5, 6.5, 8.0, 13.5, 16.5]


เราจะเห็นว่าทั้งการอ้างอิงอาร์เรย์เพื่อนำค่ามาใช้หรือการกำหนดค่าให้กับสมาชิกในอาร์เรย์ต่างก็ใช้รูปแบบ `values[i]` เหมือนกัน

นอกจากนี้สิ่งที่เราเห็นจากตัวอย่างนี้อีกอย่างคือการแสดงค่าอาร์เรย์ซึ่งเราใช้ `Arrays.toString`

## คลาส Arrays

การจัดการกับข้อมูลชนิดอาร์เรย์โดยเบื้องต้นแล้วทำได้เพียงการสร้างอาร์เรย์และการอ้างอิงสมาชิกของอาร์เรย์ แต่งานบางอย่างที่ควรจะทำได้ง่ายก็ค่อนข้างยุ่งยากถ้าจะจัดการโดยตรง เช่น การเปรียบเทียบว่าอาร์เรย์ 2 ตัวมีค่าเท่ากัน การกำหนดค่าเดียวกันให้กับสมาชิกทุกตัวในอาร์เรย์ หรือการแสดงค่าอาร์เรย์ทั้งหมดออกทางจอภาพ

แต่ JDK ก็ให้เครื่องมือจัดการกับอาร์เรย์เพิ่มเติมมาในรูปของคลาสอำนวยความสะดวกชื่อว่า `Arrays`

คลาสนี้ชื่อว่า `Arrays` แต่โดยตัวมันเองไม่ได้เป็นอาร์เรย์ เป็นเพียงคลาสที่รวบรวมเอาเมทอดที่เกี่ยวข้องกับการจัดการกับอาร์เรย์เอาไว้ในตัว เมทอดที่น่าสนใจมีดังนี้

- `sort` ใช้เรียงลำดับข้อมูลในอาร์เรย์จากน้อยไปมาก
- `fill` ใช้เพื่อใส่ค่าที่กำหนดเข้าไปในสมาชิกของอาร์เรย์ทีละหลาย ๆ ตัว
- `copyOf` ใช้เพื่อสร้างอาร์เรย์ใหม่ที่มีข้อมูลเหมือนอาร์เรย์เดิม
- `equals` ใช้เปรียบเทียบของสมาชิกระหว่างอาร์เรย์ 2 ตัวว่าเหมือนกันทั้งหมดหรือไม่
- `toString` ใช้เมื่อต้องการสตริงที่แสดงค่าของสมาชิกแต่ละตัวในอาร์เรย์ ถ้าเป็นอาร์เรย์ซ้อนกันหรืออาร์เรย์หลายมิติควรใช้ `deepToString`
- `binarySearch` ใช้ค้นหาข้อมูลที่ต้องการในอาร์เรย์ มีเงื่อนไขว่าข้อมูลในอาร์เรย์ต้องเรียงลำดับมาก่อนจึงจะเรียกใช้ได้

เมทอดอื่น ๆ ของคลาส Arrays ที่น่าสนใจสามารถศึกษาเพิ่มเติมได้ที่นี่ https://docs.oracle.com/javase/9/docs/api/java/util/Arrays.html

ตัวอย่างการใช้งานคลาส `Arrays`

In [28]:
double[] scores = { 9.1, 6.25, 2.5, 5.0, 1.25, 7.5, 0.25 };

System.out.printf("Original values: %s%n", Arrays.toString(scores));

double[] copiedScores = Arrays.copyOf(scores, scores.length);
System.out.printf("Copied values: %s%n", Arrays.toString(copiedScores));

if (Arrays.equals(scores, copiedScores)) {
    System.out.println("Original and copied arrays are equal.");
} else {
    System.out.println("Original and copied arrays are now different.");
}

Arrays.sort(scores);
System.out.printf("Sorted values: %s%n", Arrays.toString(scores));

System.out.printf("Found 6.25 at position %d.%n", Arrays.binarySearch(scores, 6.25));

if (Arrays.equals(scores, copiedScores)) {
    System.out.println("Original and copied arrays are equal.");
} else {
    System.out.println("Original and copied arrays are now different.");
}

Arrays.fill(copiedScores, 1.23);
System.out.printf("Copied array after fill operation: %s%n", Arrays.toString(copiedScores));

Original values: [9.1, 6.25, 2.5, 5.0, 1.25, 7.5, 0.25]
Copied values: [9.1, 6.25, 2.5, 5.0, 1.25, 7.5, 0.25]
Original and copied arrays are equal.
Sorted values: [0.25, 1.25, 2.5, 5.0, 6.25, 7.5, 9.1]
Found 6.25 at position 4.
Original and copied arrays are now different.
Copied array after fill operation: [1.23, 1.23, 1.23, 1.23, 1.23, 1.23, 1.23]


ในตัวอย่างนี้เราเริ่มต้นด้วยการสร้างอาร์เรย์ `scores` ซึ่งมีข้อมูลไม่เรียงลำดับอยู่จำนวนหนึ่ง และแสดงข้อมูลนั้นโดยใช้ `Arrays.toString` เพื่อเรียกเอาสตริงที่แสดงข้อมูลในอาร์เรย์ออกมาแสดงผล จากนั้นเราก็ทดสอบการสร้างอาร์เรย์ใหม่ที่มีข้อมูลเหมือนอาร์เรย์เดิมโดยใช้ `Arrays.copyOf` และทดสอบว่าอาร์เรย์ใหม่และอาร์เรย์เดิมมีข้อมูลเหมือนกันด้วย `Arrays.equals`

ต่อจากนั้นจึงเอา `scores` มาเรียงลำดับด้วย `Arrays.sort` และใช้ `Arrays.binarySearch` ค้นหาตำแหน่งของข้อมูลที่ต้องการและแสดงออกมา การทดสอบว่าอาร์เรย์ `scores` และ `copiedScores` เท่ากันหรือไม่อีกครั้งแสดงให้เห็นว่าไม่เท่ากันแล้วเนื่องจาก `scores` ถูกนำไปเรียงลำดับ สุดท้ายเป็นการใช้ `Arrays.fill` เพื่อใส่ค่าที่ต้องการในทุกสมาชิกของอาร์เรย์ `copiedScores`

เรารู้ว่าการขยายขนาดอาร์เรย์ไม่สามารถทำได้โดยตรง แต่เราสามารถสร้างอาร์เรย์ใหม่มาแทนที่โดยกำหนดให้มีขนาดใหม่ที่ต้องการแล้วย้ายข้อมูลจากอาร์เรย์เดิมไปโดยใช้ `Arrays.copyOf` ได้ ดังตัวอย่างนี้

In [29]:
double[] scores = { 9.1, 6.25, 2.5, 5.0, 1.25, 7.5, 0.25 };
int newSize = 2 * scores.length;

scores = Arrays.copyOf(scores, newSize);
System.out.printf("Scores after resizing: %s%n", Arrays.toString(scores));

Scores after resizing: [9.1, 6.25, 2.5, 5.0, 1.25, 7.5, 0.25, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0]


## อาร์เรย์หลายมิติ

ปัญหาบางประเภทจำเป็นต้องใช้โครงสร้างหลายมิติ เช่น การคำนวณเมทริกซ์ การจำลองโมเดลเชิงปริมาตรต่าง ๆ เป็นต้น เราสามารถกำหนดอาร์เรย์ให้มีหลายมิติเพื่อรองรับปัญหาเหล่านี้ได้

อาร์เรย์หลายมิติในความเป็นจริงแล้วคืออาร์เรย์ที่ซ้อนกันอยู่ หรือเรียกว่าอาร์เรย์ของอาร์เรย์ เราสามารถประกาศอาร์เรย์หลายมิติและกำหนดค่าตั้งต้นให้ได้หลายรูปแบบดังตัวอย่างต่อไปนี้

In [40]:
double[][] matrixA = new double[][] {{ 1.2, 2.4, 3.6 }, { 1.3, 2.6, 3.9 }};
System.out.println("matrixA:");
System.out.printf("%s%n", Arrays.toString(matrixA));
System.out.printf("%s%n", Arrays.deepToString(matrixA));

int[][] zerosTable = new int[3][5];
System.out.println("zerosTable:");
System.out.printf("%s%n", Arrays.deepToString(zerosTable));

double[][] matrixB = {{ 1.2, 2.4 }, { 3.6, 1.3 }, { 2.6, 3.9 }};
System.out.println("matrixB:");
System.out.printf("%s%n", Arrays.deepToString(matrixB));

int[][] jaggedData = {{ 1, 2, 3 }, { 1, 2 }, { 1, 2 }, { 1 }};
System.out.println("jaggedData:");
System.out.printf("%s%n", Arrays.deepToString(jaggedData));

int[][] anotherJagger = new int[3][];
anotherJagger[0] = new int[] { 3, 2, 1 };
anotherJagger[1] = new int[5];
anotherJagger[2] = new int[] { 4, 2 };
System.out.println("anotherJagger:");
System.out.printf("%s%n", Arrays.deepToString(anotherJagger));

matrixA:
[[D@52525845, [D@3b94d659]
[[1.2, 2.4, 3.6], [1.3, 2.6, 3.9]]
zerosTable:
[[0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0]]
matrixB:
[[1.2, 2.4], [3.6, 1.3], [2.6, 3.9]]
jaggedData:
[[1, 2, 3], [1, 2], [1, 2], [1]]
anotherJagger:
[[3, 2, 1], [0, 0, 0, 0, 0], [4, 2]]


`matrixA` ถูกประกาศเป็นอาร์เรย์ 2 มิติของ `double` โดยขนาดของแต่ละมิติถูกกำหนดโดยตัวข้อมูลที่ใช้เป็นค่าตั้งต้น ซึ่งในที่นี้จะได้เป็นเมทริกซ์ขนาด 2×3 ในขณะที่ `zerosTable` ถูกกำหนดขนาดด้วยการระบุเป็นมิติลงไปโดยตรง ค่าตั้งต้นของสมาชิกแต่ละตัวให้เป็นค่าโดยปริยายซึ่งในที่นี้คือ 0

ในส่วนการแสดงค่าของอาร์เรย์ เราทดลองใช้ทั้ง `Arrays.toString` และ `Arrays.deepToString` ซึ่งจะเห็นได้ว่าในกรณีที่เป็นอาร์เรย์มากกว่ามิติเดียว เราจำเป็นต้องใช้ `Arrays.deepToString`

`jaggedData` แสดงตัวอย่างให้เห็นอาร์เรย์ที่มีขนาดแต่ละแถวไม่เท่ากัน (jagged array) ในตัวอย่างนี้จะมีขนาดสมาชิกในแต่ละแถวเป็น 3, 2, 2 และ 1 สมาชิกตามลำดับ ซึ่งบ่งชี้ว่าอาร์เรย์ที่ซ้อนอยู่แต่ละแถวเป็นอิสระต่อกัน ไม่จำเป็นต้องมีขนาดเท่ากัน

`anotherJagger` เป็นอาร์เรย์ที่มีขนาดแต่ละแถวไม่เท่ากันอีกตัวหนึ่ง แต่ในตัวอย่างนี้เราสร้างอาร์เรย์มิติแรกขึ้นมาก่อน แล้วค่อยทยอยสร้างมิติที่สองทีละแถวในภายหลัง

เราใช้ `Arrays.deepToString` เพื่อช่วยในการแสดงผลอาร์เรย์หลายมิติ แต่คลาส `Arrays` ก็ไม่มีเมทอดอำนวยความสะดวกสำหรับอาร์เรย์หลายมิติมากนัก เช่น `Arrays.copyOf` ก็ไม่สามารถใช้กับอาร์เรย์ซ้อนได้

## คลาส ArrayList

`ArrayList` มีความยืดหยุ่นสูงกว่าอาร์เรย์และมีประสิทธิภาพในระดับใกล้เคียงกับอาร์เรย์ เพราะการทำงานภายในของ `ArrayList` ก็ใช้อาร์เรย์อยู่เบื้องหลัง แต่ถ้าเราต้องการใช้งานกับข้อมูลชนิดพื้นฐาน (primitive type) ซึ่ง `ArrayList` ไม่สามารถทำได้โดยตรง ต้องมีการสร้างอ็อบเจกต์จาก wrapper class ขึ้นมาเก็บข้อมูลแต่ละตัว และอาจจะมีกระบวนการ boxing/unboxing เกิดขึ้นระหว่างที่เราอ้างอิงข้อมูลด้วย ซึ่งส่งผลกระทบต่อประสิทธิภาพได้ ในกรณีนี้อาร์เรย์ก็อาจจะเป็นตัวเลือกที่ดีกว่า

สตริง

การวนซ้ำบน collection

enum การแจงนับ

HashMap