# Lambda

## Notes

* Các hàm `lambda` là các hàm nhỏ, ẩn danh.
* Chúng có thể có bất kỳ số lượng tham số nào nhưng chỉ có một biểu thức.
* Biểu thức được đánh giá và trả về kết quả.
* Cú pháp của hàm `lambda` là: `lambda arguments: expression`.
* Lý do nên dùng `lambda` trong một vài trường hợp thay vì dùng `def`
    * Ngắn gọn, viết hàm trong một dòng mã.
    * Vì là hàm ẩn danh, nó không yêu cầu một tên riêng biệt như các hàm thông thường được định nghĩa bằng từ khóa `def` (rất hữu ích khi cần làm một hàm tạm thời).


## Importance

Cung cấp một cách ngắn gọn để định nghĩa các hàm ẩn danh. Hữu ích trong pandas để áp dụng các phép biến đổi nhanh chóng cho dữ liệu.

In [2]:
# cú pháp `lambda arguments: expression`
add = lambda x, y: x + y

In [3]:
result1 = add(3, 5)
result1

8

## Example

Khi dùng `def`

In [11]:
salary_list = [100000, 200000, 150000, 120000, 80000, 750000]

def calculate_salary(base_salary, bonus_rate=.1):
  return base_salary * (1 + bonus_rate)

total_salary_list = [calculate_salary(salary) for salary in salary_list]

total_salary_list

[110000.00000000001,
 220000.00000000003,
 165000.0,
 132000.0,
 88000.0,
 825000.0000000001]

khi dùng `lambda`

In [5]:
total_salary_list = [(lambda x: x * (1.1))(salary) for salary in salary_list]

total_salary_list

[110000.00000000001,
 220000.00000000003,
 165000.0,
 132000.0,
 88000.0,
 825000.0000000001]

Và có thể không dùng tới hàm trong ví dụ trên

In [6]:
total_salary_list = [salary * 1.1 for salary in salary_list]

total_salary_list

[110000.00000000001,
 220000.00000000003,
 165000.0,
 132000.0,
 88000.0,
 825000.0000000001]

# Filter()

Hàm` filter() `nhận vào một hàm và một danh sách, sau đó lọc các phần tử trong danh sách thỏa mãn điều kiện của hàm.

## Ví dụ

Lọc các bài đăng tuyển dụng dựa trên các điều kiện sau:
- Kỹ năng công việc chứa "Python"
- Công việc là làm từ xa (tức là `True`)

In [7]:
jobs_data = [
    {'job_title': 'Data Scientist',  'job_skills': ['Python', 'Machine Learning'], 'remote': True},
    {'job_title': 'Data Analyst',  'job_skills': ['Excel', 'SQL'], 'remote': False},
    {'job_title': 'Machine Learning Engineer', 'job_skills': ['Python', 'TensorFlow', 'Keras'], 'remote': True},
    {'job_title': 'Software Developer', 'job_skills': ['Java', 'C++'], 'remote': True},
    {'job_title': 'Data Scientist', 'job_skills': ['R', 'Statistics'], 'remote': False}
]

Để giải quyết bài toán trên thì mình dùng tới `filter`

In [8]:
help(filter)

Help on class filter in module builtins:

class filter(object)
 |  filter(function, iterable, /)
 |
 |  Return an iterator yielding those items of iterable for which function(item)
 |  is true. If function is None, return the items that are true.
 |
 |  Methods defined here:
 |
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |
 |  __iter__(self, /)
 |      Implement iter(self).
 |
 |  __next__(self, /)
 |      Implement next(self).
 |
 |  __reduce__(self, /)
 |      Return state information for pickling.
 |
 |  ----------------------------------------------------------------------
 |  Static methods defined here:
 |
 |  __new__(*args, **kwargs)
 |      Create and return a new object.  See help(type) for accurate signature.



Đối với hàm `filter()`, nó nhận vào hai đối số:
- **function** (Trong bài này là hàm lambda)
- **iterable** (Là đối tượng trả về, filter chỉ chứa các phần tử của interrable mà function trả về True )
 
Cú pháp `filter(function or None, iterable) --> filter object`

- Nếu đối số function là None, thì filter() sẽ chỉ trả về các phần tử có giá trị "True".


In [None]:
list(filter(lambda job: job['remote'], jobs_data))

[{'job_title': 'Data Scientist',
  'job_skills': ['Python', 'Machine Learning'],
  'remote': True},
 {'job_title': 'Machine Learning Engineer',
  'job_skills': ['Python', 'TensorFlow', 'Keras'],
  'remote': True},
 {'job_title': 'Software Developer',
  'job_skills': ['Java', 'C++'],
  'remote': True}]

Dễ đọc hơn:

In [None]:
filter_criteria = lambda job: 'Python' in job['job_skills'] and job['remote']

python_remote_jobs = list(filter(filter_criteria, jobs_data))

for job in python_remote_jobs:
    print(job)

{'job_title': 'Data Scientist', 'job_skills': ['Python', 'Machine Learning'], 'remote': True}
{'job_title': 'Machine Learning Engineer', 'job_skills': ['Python', 'TensorFlow', 'Keras'], 'remote': True}


Hoặc có thể dùng `def`

In [13]:
def is_remote_job(job):
    return job['remote']

filtered_jobs = list(filter(is_remote_job, jobs_data))

filtered_jobs

[{'job_title': 'Data Scientist',
  'job_skills': ['Python', 'Machine Learning'],
  'remote': True},
 {'job_title': 'Machine Learning Engineer',
  'job_skills': ['Python', 'TensorFlow', 'Keras'],
  'remote': True},
 {'job_title': 'Software Developer',
  'job_skills': ['Java', 'C++'],
  'remote': True}]