# **Data Types** 

*Kiểu dữ liệu*

### **Note**

* Python có thể lưu trữ dữ liệu của các kiểu khác nhau.
* Các kiểu dữ liệu này có thể thực hiện những tác vụ khác nhau.


### Các thao tác trên từng kiểu dữ liệu

Với kiểu `int` ta có thể thuecj hiện các phep toán `+` `-`...

In [16]:
total_salary = 110000
bonus_salary = 10000

In [17]:
type(total_salary)

int

In [18]:
base_salary = total_salary - bonus_salary

base_salary

100000

Tuy nhiên, chúng ta không thể làm những điều tương tự với kiểu `str`

In [19]:
job_title = 'Data Analyst'
remove_word = 'Data'

In [20]:
type(job_title)


str

In [21]:
final_title = job_title - remove_word

final_title

TypeError: unsupported operand type(s) for -: 'str' and 'str'

### Có thể xem nhiều thông tin hơn tại [đây](https://docs.python.org/3/library/datatypes.html)


## **Các kiểu dữ liệu thường gặp trong phân tích dữ liệu**

* Kiểu chuỗi: `str`
* kiểu số: `int`, `float`
* kiểu dãy: `list`, `tuple`
* kiểu bản đồ: `dict`
* kiểu tập hợp: `set`

## **Notes**

* Xem kiểu dữ liệu bằng cách sử dụng hàm `type()`

## **Ví Dụ**

In [None]:
company_name = "DataWiz Inc."

type(company_name)

str

Mình cũng có thể sử dụng lồng hàm (hàm trong hàm)

In [None]:
print(type(company_name))

<class 'str'>


### Dùng `type()` để kiểm tra kiểu dữ liệu

In [None]:
job_id = 102
company_name = 'Data Nerd, Inc.'
job_title = 'Data Scientist'
salary_rate = 170000.00
job_work_from_home = True

In [None]:
print(type(job_id))
print(type(company_name))
print(type(job_title))
print(type(salary_rate))
print(type(job_work_from_home))

<class 'int'>
<class 'str'>
<class 'str'>
<class 'float'>
<class 'bool'>


Mình cũng có thể kiểm tra xem một biến có dúng là kiểu kiểu dữ liệu mà mình muốn không bằng cú pháp: `isinstance(Object, type)`

* Object - đối tượng bạn muốn kiểm tra
* Type - kiểu dữ liệu (kiểu mình đang muốn kiểm tra đối tượng có phải là nó hay không)

Nếu đúng thì `True` sai thì `False`

## **Ví dụ**

In [None]:
isinstance(job_id, float)

False

In [None]:
isinstance(company_name, str)

True

Sử dụng `help()` để tìm hiểu về các kiểu dữ liệu (hoặc thực sự bất kỳ đối tượng nào)
Chúng ta có thể sử dụng hàm help() để tìm hiểu về các kiểu dữ liệu, hàm, phương thức... thực sự là bất kỳ đối tượng nào!

In [None]:
help(isinstance)

Help on built-in function isinstance in module builtins:

isinstance(obj, class_or_tuple, /)
    Return whether an object is an instance of a class or of a subclass thereof.

    A tuple, as in ``isinstance(x, (A, B, ...))``, may be given as the target to
    check against. This is equivalent to ``isinstance(x, A) or isinstance(x, B)
    or ...`` etc.



Sử dụng hàm `help()`, chúng ta có thể xem những "phương thức" nào có sẵn cho một kiểu dữ liệu

In [None]:
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to 'utf-8'.
 |  errors defaults to 'strict'.
 |
 |  Methods defined here:
 |
 |  __add__(self, value, /)
 |      Return self+value.
 |
 |  __contains__(self, key, /)
 |      Return bool(key in self).
 |
 |  __eq__(self, value, /)
 |      Return self==value.
 |
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |
 |  __ge__(self, value, /)
 |      Return self>=value.
 |
 |  __getitem__(self, key, /)
 |      Return self[key].
 |
 |  __getnewargs__(self, /)
 |
 |  __gt__(self, v

| Kiểu dữ liệu   | Cú pháp          | Ví dụ                                     |
|----------------|------------------|-------------------------------------------|
| String         | `str()`          | `str('Hello World')`                      |
| Integer        | `int()`          | `int(20)`                                 |
| Float          | `float()`        | `float(20.5)`                             |
| Complex        | `complex()`      | `complex(1j)`                             |
| List           | `list()`         | `list(('apple', 'banana', 'cherry'))`     |
| Tuple          | `tuple()`        | `tuple(('apple', 'banana', 'cherry'))`    |
| Range          | `range()`        | `range(6)`                                |
| Dictionary     | `dict()`         | `dict(name='John', age=36)`               |
| Set            | `set()`          | `set(('apple', 'banana', 'cherry'))`      |
| Frozenset      | `frozenset()`    | `frozenset(('apple', 'banana', 'cherry'))`|
| Boolean        | `bool()`         | `bool(5)`                                 |
| Bytes          | `bytes()`        | `bytes(5)`                                |
| Bytearray      | `bytearray()`    | `bytearray(5)`                            |
| Memoryview     | `memoryview()`   | `memoryview(bytes(5))`                    |


## **Ví dụ**: Cách Debug

*company_name = str('Data Nerd, Inc.)*

Các bước debug:

1. Xem xét lỗi, coi nó là lỗi gì, bản thân mình có nhận ra được vấn đề không?
2. Nếu không hiểu vấn đề mình có thể dùng trợ giúp tuwf bên ngoài.
     * Sử dụng ChatGPT or Claude
     * Tìm kiếm trên google
