In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.pipeline import Pipeline
from sklearn.feature_selection import SelectKBest
from sklearn.metrics import r2_score
from xgboost import XGBRegressor

In [2]:
# Load your dataset (replace 'cleaned_data_house_price.csv' with your dataset file)
dataset = pd.read_csv("cleaned_data_house_price.csv")


In [3]:
dataset1 = pd.read_csv("cleaned_data_house_price.csv", index_col=None)

# Take a backup of the original dataset
df2 = dataset1.copy()

# Perform one-hot encoding to handle categorical variables
df2 = pd.get_dummies(df2, drop_first=True)  # remove first redundant col wrt to nominal col


# Assuming 'price_per_sqft' is your target variable, and other columns are features
X = df2.drop(columns=['price_per_sqft'])
y = df2['price_per_sqft']

In [4]:
# Split data into train and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [5]:
# Define the pipeline
xgb_pipeline = Pipeline([
    ('feature_selection', SelectKBest()),
    ('boosting', XGBRegressor())
])

In [6]:
# Define the parameter grid
param_grid = {
    'boosting__n_estimators': [100, 200, 300],  # Number of boosting rounds
    'boosting__learning_rate': [0.01, 0.1, 0.2],  # Learning rate
    'feature_selection__k': [2, 5, 10]  # Number of features to select
}

In [7]:
# Perform GridSearchCV
grid_search = GridSearchCV(xgb_pipeline, param_grid, cv=5, scoring='r2')
grid_search.fit(X_train, y_train)


  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  50  59  63  65  66  68  69  72  74  75  78  84
  85  91  94  95  98 102 106 107 108 112 114 118 119 123 125 128 135 139
 148 149 150 151 152 156 157 159 160 162 170 171 172 175 180 183 186 187
 189 196 201 202 203 208 211 214 220 221 222 225 229 230 237 238 242 243
 245 251 252 259 263 264 265 266 269 272 273 274 275 277 278 284 287 289
 291 293 294 296 300 301 303 305 315 323 329 330 337 338 340 342 344 351
 355 359 361 362 364 365 370 372 376 384 387 392 394 395 398 401 408 409
 410 419 421 424 426 430 431 433 443 449 453 454 456 458 459 461 464 469
 473 474 476 479 481 485 489 495 496 498 500 505 506 507 510 512 515 522
 539 544 545 546 547 548 549 556 557 558 560 561 565 570 574 575 579 580
 584 590 591 593 598 599 602 603 606 607 608 609 611 613 614 615 621 623
 624 626 627 631 632 634 635 638 639 641 642 645 649 652 653 656 657 658
 662 663 664 668 669 671 672 675 678 679 680 685 687 697 700 702 706 708
 709 71

  42  43  45  46  47  49  65  66  68  69  72  73  74  75  77  78  85  86
  90  91  95  96  97  98 102 106 107 109 112 114 118 119 123 125 128 129
 139 146 147 148 151 152 156 158 159 160 162 170 171 175 176 178 179 183
 186 187 188 189 190 192 196 202 203 207 208 210 211 214 219 220 221 222
 224 225 229 237 239 242 245 251 252 259 261 265 266 272 273 274 275 277
 284 287 289 293 294 296 300 301 303 308 315 316 318 323 329 330 337 338
 340 341 342 344 351 355 359 360 361 362 364 370 376 381 384 385 387 390
 392 393 394 395 398 401 407 409 411 419 420 421 424 430 431 433 448 449
 454 456 457 458 459 463 469 470 472 473 474 476 481 485 489 494 498 499
 500 506 507 510 512 519 522 534 536 543 544 545 547 550 556 557 558 560
 561 565 570 572 575 576 581 584 585 588 592 597 599 606 607 609 610 611
 613 617 621 623 624 626 627 635 638 639 641 642 643 645 648 649 652 653
 654 656 658 662 663 665 668 672 673 674 675 678 679 680 685 697 698 700
 706 708 712 713 714 715 717 718 722 724 726 727 72

  42  45  46  47  49  50  54  65  66  68  69  72  74  75  78  83  85  91
  92  95  98 102 106 107 112 114 118 119 123 125 128 133 139 140 148 149
 151 152 154 156 159 162 164 170 171 175 176 178 183 186 187 189 194 196
 202 203 205 211 212 214 215 220 221 222 225 229 231 237 238 240 242 244
 245 251 252 253 263 265 266 271 272 273 274 275 277 281 284 286 287 289
 290 291 293 294 296 300 301 302 303 308 314 315 321 323 324 329 330 334
 337 338 340 342 344 351 355 359 361 362 364 370 373 376 377 384 385 387
 390 392 393 394 395 397 398 401 402 415 418 419 421 424 430 431 432 433
 436 446 449 454 456 458 459 469 473 474 475 476 481 483 485 486 487 489
 498 500 506 507 510 511 512 513 522 525 527 529 532 538 543 544 545 547
 556 557 558 560 561 564 565 570 573 575 580 584 585 599 601 602 607 609
 611 613 621 622 623 624 626 627 632 635 638 639 641 642 645 649 652 653
 656 658 659 662 663 665 666 668 675 678 679 680 681 682 685 686 691 692
 697 700 701 703 704 706 708 712 713 714 715 717 71

  if LooseVersion(joblib_version) < '0.12':
  44  45  46  47  49  61  65  66  68  69  72  74  75  76  78  80  85  88
  91  95  98 102 106 107 112 114 118 119 123 125 128 133 139 148 151 152
 153 156 159 162 164 170 171 175 183 186 187 189 196 197 198 200 202 203
 204 211 214 218 219 220 221 222 225 229 234 237 242 245 251 252 256 258
 265 266 272 273 274 275 276 277 283 284 287 289 293 294 296 300 301 302
 303 307 310 313 315 316 317 323 325 329 330 337 338 339 340 342 344 351
 355 359 361 362 364 365 370 373 376 384 387 392 394 395 398 401 415 416
 419 421 423 424 430 431 433 442 449 454 456 458 459 469 473 474 476 477
 481 485 489 498 500 501 506 507 510 511 512 519 522 523 526 536 537 544
 545 547 556 557 558 560 561 562 565 569 570 571 575 577 581 584 593 599
 607 609 611 613 621 623 624 626 627 633 635 638 639 641 642 645 648 649
 652 653 656 658 662 663 666 668 675 678 679 680 684 685 686 693 694 695
 697 700 705 706 708 712 713 714 715 717 718 722 724 725 727 728 730 734
 735 73

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  58  65  66  68  69  72  74  75  78  81  85  91
  95  98 102 104 106 107 108 112 114 116 117 118 119 123 124 125 126 127
 128 139 148 151 152 156 159 162 170 171 172 175 177 181 183 186 187 189
 196 202 203 210 211 212 214 215 216 220 221 222 223 225 228 229 232 236
 237 242 244 245 251 252 254 258 260 265 266 272 273 274 275 276 277 284
 287 289 293 294 296 297 300 301 303 304 315 323 328 329 330 332 337 338
 340 342 344 346 348 351 354 355 359 361 362 364 370 376 380 384 387 389
 392 394 395 396 398 401 402 404 407 408 412 419 421 422 423 424 430 431
 432 433 449 454 456 458 459 462 469 473 474 475 476 481 485 489 498 500
 506 507 510 512 522 526 528 540 544 545 547 549 556 557 558 560 561 565
 570 575 584 590 599 605 607 609 611 613 621 623 624 626 627 635 638 639
 641 642 643 645 649 652 653 655 656 658 659 662 663 667 668 675 678 679
 680 683 685 692 697 700 701 704 706 707 708 712 713 714 715 717 718 719
 722 72

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  50  59  63  65  66  68  69  72  74  75  78  84
  85  91  94  95  98 102 106 107 108 112 114 118 119 123 125 128 135 139
 148 149 150 151 152 156 157 159 160 162 170 171 172 175 180 183 186 187
 189 196 201 202 203 208 211 214 220 221 222 225 229 230 237 238 242 243
 245 251 252 259 263 264 265 266 269 272 273 274 275 277 278 284 287 289
 291 293 294 296 300 301 303 305 315 323 329 330 337 338 340 342 344 351
 355 359 361 362 364 365 370 372 376 384 387 392 394 395 398 401 408 409
 410 419 421 424 426 430 431 433 443 449 453 454 456 458 459 461 464 469
 473 474 476 479 481 485 489 495 496 498 500 505 506 507 510 512 515 522
 539 544 545 546 547 548 549 556 557 558 560 561 565 570 574 575 579 580
 584 590 591 593 598 599 602 603 606 607 608 609 611 613 614 615 621 623
 624 626 627 631 632 634 635 638 639 641 642 645 649 652 653 656 657 658
 662 663 664 668 669 671 672 675 678 679 680 685 687 697 700 702 706 708
 709 71

  if LooseVersion(joblib_version) < '0.12':
  42  43  45  46  47  49  65  66  68  69  72  73  74  75  77  78  85  86
  90  91  95  96  97  98 102 106 107 109 112 114 118 119 123 125 128 129
 139 146 147 148 151 152 156 158 159 160 162 170 171 175 176 178 179 183
 186 187 188 189 190 192 196 202 203 207 208 210 211 214 219 220 221 222
 224 225 229 237 239 242 245 251 252 259 261 265 266 272 273 274 275 277
 284 287 289 293 294 296 300 301 303 308 315 316 318 323 329 330 337 338
 340 341 342 344 351 355 359 360 361 362 364 370 376 381 384 385 387 390
 392 393 394 395 398 401 407 409 411 419 420 421 424 430 431 433 448 449
 454 456 457 458 459 463 469 470 472 473 474 476 481 485 489 494 498 499
 500 506 507 510 512 519 522 534 536 543 544 545 547 550 556 557 558 560
 561 565 570 572 575 576 581 584 585 588 592 597 599 606 607 609 610 611
 613 617 621 623 624 626 627 635 638 639 641 642 643 645 648 649 652 653
 654 656 658 662 663 665 668 672 673 674 675 678 679 680 685 697 698 700
 706 70

  if LooseVersion(joblib_version) < '0.12':
  42  45  46  47  49  50  54  65  66  68  69  72  74  75  78  83  85  91
  92  95  98 102 106 107 112 114 118 119 123 125 128 133 139 140 148 149
 151 152 154 156 159 162 164 170 171 175 176 178 183 186 187 189 194 196
 202 203 205 211 212 214 215 220 221 222 225 229 231 237 238 240 242 244
 245 251 252 253 263 265 266 271 272 273 274 275 277 281 284 286 287 289
 290 291 293 294 296 300 301 302 303 308 314 315 321 323 324 329 330 334
 337 338 340 342 344 351 355 359 361 362 364 370 373 376 377 384 385 387
 390 392 393 394 395 397 398 401 402 415 418 419 421 424 430 431 432 433
 436 446 449 454 456 458 459 469 473 474 475 476 481 483 485 486 487 489
 498 500 506 507 510 511 512 513 522 525 527 529 532 538 543 544 545 547
 556 557 558 560 561 564 565 570 573 575 580 584 585 599 601 602 607 609
 611 613 621 622 623 624 626 627 632 635 638 639 641 642 645 649 652 653
 656 658 659 662 663 665 666 668 675 678 679 680 681 682 685 686 691 692
 697 70

  if LooseVersion(joblib_version) < '0.12':
  44  45  46  47  49  61  65  66  68  69  72  74  75  76  78  80  85  88
  91  95  98 102 106 107 112 114 118 119 123 125 128 133 139 148 151 152
 153 156 159 162 164 170 171 175 183 186 187 189 196 197 198 200 202 203
 204 211 214 218 219 220 221 222 225 229 234 237 242 245 251 252 256 258
 265 266 272 273 274 275 276 277 283 284 287 289 293 294 296 300 301 302
 303 307 310 313 315 316 317 323 325 329 330 337 338 339 340 342 344 351
 355 359 361 362 364 365 370 373 376 384 387 392 394 395 398 401 415 416
 419 421 423 424 430 431 433 442 449 454 456 458 459 469 473 474 476 477
 481 485 489 498 500 501 506 507 510 511 512 519 522 523 526 536 537 544
 545 547 556 557 558 560 561 562 565 569 570 571 575 577 581 584 593 599
 607 609 611 613 621 623 624 626 627 633 635 638 639 641 642 645 648 649
 652 653 656 658 662 663 666 668 675 678 679 680 684 685 686 693 694 695
 697 700 705 706 708 712 713 714 715 717 718 722 724 725 727 728 730 734
 735 73

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  58  65  66  68  69  72  74  75  78  81  85  91
  95  98 102 104 106 107 108 112 114 116 117 118 119 123 124 125 126 127
 128 139 148 151 152 156 159 162 170 171 172 175 177 181 183 186 187 189
 196 202 203 210 211 212 214 215 216 220 221 222 223 225 228 229 232 236
 237 242 244 245 251 252 254 258 260 265 266 272 273 274 275 276 277 284
 287 289 293 294 296 297 300 301 303 304 315 323 328 329 330 332 337 338
 340 342 344 346 348 351 354 355 359 361 362 364 370 376 380 384 387 389
 392 394 395 396 398 401 402 404 407 408 412 419 421 422 423 424 430 431
 432 433 449 454 456 458 459 462 469 473 474 475 476 481 485 489 498 500
 506 507 510 512 522 526 528 540 544 545 547 549 556 557 558 560 561 565
 570 575 584 590 599 605 607 609 611 613 621 623 624 626 627 635 638 639
 641 642 643 645 649 652 653 655 656 658 659 662 663 667 668 675 678 679
 680 683 685 692 697 700 701 704 706 707 708 712 713 714 715 717 718 719
 722 72

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  50  59  63  65  66  68  69  72  74  75  78  84
  85  91  94  95  98 102 106 107 108 112 114 118 119 123 125 128 135 139
 148 149 150 151 152 156 157 159 160 162 170 171 172 175 180 183 186 187
 189 196 201 202 203 208 211 214 220 221 222 225 229 230 237 238 242 243
 245 251 252 259 263 264 265 266 269 272 273 274 275 277 278 284 287 289
 291 293 294 296 300 301 303 305 315 323 329 330 337 338 340 342 344 351
 355 359 361 362 364 365 370 372 376 384 387 392 394 395 398 401 408 409
 410 419 421 424 426 430 431 433 443 449 453 454 456 458 459 461 464 469
 473 474 476 479 481 485 489 495 496 498 500 505 506 507 510 512 515 522
 539 544 545 546 547 548 549 556 557 558 560 561 565 570 574 575 579 580
 584 590 591 593 598 599 602 603 606 607 608 609 611 613 614 615 621 623
 624 626 627 631 632 634 635 638 639 641 642 645 649 652 653 656 657 658
 662 663 664 668 669 671 672 675 678 679 680 685 687 697 700 702 706 708
 709 71

  if LooseVersion(joblib_version) < '0.12':
  42  43  45  46  47  49  65  66  68  69  72  73  74  75  77  78  85  86
  90  91  95  96  97  98 102 106 107 109 112 114 118 119 123 125 128 129
 139 146 147 148 151 152 156 158 159 160 162 170 171 175 176 178 179 183
 186 187 188 189 190 192 196 202 203 207 208 210 211 214 219 220 221 222
 224 225 229 237 239 242 245 251 252 259 261 265 266 272 273 274 275 277
 284 287 289 293 294 296 300 301 303 308 315 316 318 323 329 330 337 338
 340 341 342 344 351 355 359 360 361 362 364 370 376 381 384 385 387 390
 392 393 394 395 398 401 407 409 411 419 420 421 424 430 431 433 448 449
 454 456 457 458 459 463 469 470 472 473 474 476 481 485 489 494 498 499
 500 506 507 510 512 519 522 534 536 543 544 545 547 550 556 557 558 560
 561 565 570 572 575 576 581 584 585 588 592 597 599 606 607 609 610 611
 613 617 621 623 624 626 627 635 638 639 641 642 643 645 648 649 652 653
 654 656 658 662 663 665 668 672 673 674 675 678 679 680 685 697 698 700
 706 70

  42  45  46  47  49  50  54  65  66  68  69  72  74  75  78  83  85  91
  92  95  98 102 106 107 112 114 118 119 123 125 128 133 139 140 148 149
 151 152 154 156 159 162 164 170 171 175 176 178 183 186 187 189 194 196
 202 203 205 211 212 214 215 220 221 222 225 229 231 237 238 240 242 244
 245 251 252 253 263 265 266 271 272 273 274 275 277 281 284 286 287 289
 290 291 293 294 296 300 301 302 303 308 314 315 321 323 324 329 330 334
 337 338 340 342 344 351 355 359 361 362 364 370 373 376 377 384 385 387
 390 392 393 394 395 397 398 401 402 415 418 419 421 424 430 431 432 433
 436 446 449 454 456 458 459 469 473 474 475 476 481 483 485 486 487 489
 498 500 506 507 510 511 512 513 522 525 527 529 532 538 543 544 545 547
 556 557 558 560 561 564 565 570 573 575 580 584 585 599 601 602 607 609
 611 613 621 622 623 624 626 627 632 635 638 639 641 642 645 649 652 653
 656 658 659 662 663 665 666 668 675 678 679 680 681 682 685 686 691 692
 697 700 701 703 704 706 708 712 713 714 715 717 71

  if LooseVersion(joblib_version) < '0.12':
  44  45  46  47  49  61  65  66  68  69  72  74  75  76  78  80  85  88
  91  95  98 102 106 107 112 114 118 119 123 125 128 133 139 148 151 152
 153 156 159 162 164 170 171 175 183 186 187 189 196 197 198 200 202 203
 204 211 214 218 219 220 221 222 225 229 234 237 242 245 251 252 256 258
 265 266 272 273 274 275 276 277 283 284 287 289 293 294 296 300 301 302
 303 307 310 313 315 316 317 323 325 329 330 337 338 339 340 342 344 351
 355 359 361 362 364 365 370 373 376 384 387 392 394 395 398 401 415 416
 419 421 423 424 430 431 433 442 449 454 456 458 459 469 473 474 476 477
 481 485 489 498 500 501 506 507 510 511 512 519 522 523 526 536 537 544
 545 547 556 557 558 560 561 562 565 569 570 571 575 577 581 584 593 599
 607 609 611 613 621 623 624 626 627 633 635 638 639 641 642 645 648 649
 652 653 656 658 662 663 666 668 675 678 679 680 684 685 686 693 694 695
 697 700 705 706 708 712 713 714 715 717 718 722 724 725 727 728 730 734
 735 73

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  58  65  66  68  69  72  74  75  78  81  85  91
  95  98 102 104 106 107 108 112 114 116 117 118 119 123 124 125 126 127
 128 139 148 151 152 156 159 162 170 171 172 175 177 181 183 186 187 189
 196 202 203 210 211 212 214 215 216 220 221 222 223 225 228 229 232 236
 237 242 244 245 251 252 254 258 260 265 266 272 273 274 275 276 277 284
 287 289 293 294 296 297 300 301 303 304 315 323 328 329 330 332 337 338
 340 342 344 346 348 351 354 355 359 361 362 364 370 376 380 384 387 389
 392 394 395 396 398 401 402 404 407 408 412 419 421 422 423 424 430 431
 432 433 449 454 456 458 459 462 469 473 474 475 476 481 485 489 498 500
 506 507 510 512 522 526 528 540 544 545 547 549 556 557 558 560 561 565
 570 575 584 590 599 605 607 609 611 613 621 623 624 626 627 635 638 639
 641 642 643 645 649 652 653 655 656 658 659 662 663 667 668 675 678 679
 680 683 685 692 697 700 701 704 706 707 708 712 713 714 715 717 718 719
 722 72

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  50  59  63  65  66  68  69  72  74  75  78  84
  85  91  94  95  98 102 106 107 108 112 114 118 119 123 125 128 135 139
 148 149 150 151 152 156 157 159 160 162 170 171 172 175 180 183 186 187
 189 196 201 202 203 208 211 214 220 221 222 225 229 230 237 238 242 243
 245 251 252 259 263 264 265 266 269 272 273 274 275 277 278 284 287 289
 291 293 294 296 300 301 303 305 315 323 329 330 337 338 340 342 344 351
 355 359 361 362 364 365 370 372 376 384 387 392 394 395 398 401 408 409
 410 419 421 424 426 430 431 433 443 449 453 454 456 458 459 461 464 469
 473 474 476 479 481 485 489 495 496 498 500 505 506 507 510 512 515 522
 539 544 545 546 547 548 549 556 557 558 560 561 565 570 574 575 579 580
 584 590 591 593 598 599 602 603 606 607 608 609 611 613 614 615 621 623
 624 626 627 631 632 634 635 638 639 641 642 645 649 652 653 656 657 658
 662 663 664 668 669 671 672 675 678 679 680 685 687 697 700 702 706 708
 709 71

  if LooseVersion(joblib_version) < '0.12':
  42  43  45  46  47  49  65  66  68  69  72  73  74  75  77  78  85  86
  90  91  95  96  97  98 102 106 107 109 112 114 118 119 123 125 128 129
 139 146 147 148 151 152 156 158 159 160 162 170 171 175 176 178 179 183
 186 187 188 189 190 192 196 202 203 207 208 210 211 214 219 220 221 222
 224 225 229 237 239 242 245 251 252 259 261 265 266 272 273 274 275 277
 284 287 289 293 294 296 300 301 303 308 315 316 318 323 329 330 337 338
 340 341 342 344 351 355 359 360 361 362 364 370 376 381 384 385 387 390
 392 393 394 395 398 401 407 409 411 419 420 421 424 430 431 433 448 449
 454 456 457 458 459 463 469 470 472 473 474 476 481 485 489 494 498 499
 500 506 507 510 512 519 522 534 536 543 544 545 547 550 556 557 558 560
 561 565 570 572 575 576 581 584 585 588 592 597 599 606 607 609 610 611
 613 617 621 623 624 626 627 635 638 639 641 642 643 645 648 649 652 653
 654 656 658 662 663 665 668 672 673 674 675 678 679 680 685 697 698 700
 706 70

  if LooseVersion(joblib_version) < '0.12':
  42  45  46  47  49  50  54  65  66  68  69  72  74  75  78  83  85  91
  92  95  98 102 106 107 112 114 118 119 123 125 128 133 139 140 148 149
 151 152 154 156 159 162 164 170 171 175 176 178 183 186 187 189 194 196
 202 203 205 211 212 214 215 220 221 222 225 229 231 237 238 240 242 244
 245 251 252 253 263 265 266 271 272 273 274 275 277 281 284 286 287 289
 290 291 293 294 296 300 301 302 303 308 314 315 321 323 324 329 330 334
 337 338 340 342 344 351 355 359 361 362 364 370 373 376 377 384 385 387
 390 392 393 394 395 397 398 401 402 415 418 419 421 424 430 431 432 433
 436 446 449 454 456 458 459 469 473 474 475 476 481 483 485 486 487 489
 498 500 506 507 510 511 512 513 522 525 527 529 532 538 543 544 545 547
 556 557 558 560 561 564 565 570 573 575 580 584 585 599 601 602 607 609
 611 613 621 622 623 624 626 627 632 635 638 639 641 642 645 649 652 653
 656 658 659 662 663 665 666 668 675 678 679 680 681 682 685 686 691 692
 697 70

  if LooseVersion(joblib_version) < '0.12':
  44  45  46  47  49  61  65  66  68  69  72  74  75  76  78  80  85  88
  91  95  98 102 106 107 112 114 118 119 123 125 128 133 139 148 151 152
 153 156 159 162 164 170 171 175 183 186 187 189 196 197 198 200 202 203
 204 211 214 218 219 220 221 222 225 229 234 237 242 245 251 252 256 258
 265 266 272 273 274 275 276 277 283 284 287 289 293 294 296 300 301 302
 303 307 310 313 315 316 317 323 325 329 330 337 338 339 340 342 344 351
 355 359 361 362 364 365 370 373 376 384 387 392 394 395 398 401 415 416
 419 421 423 424 430 431 433 442 449 454 456 458 459 469 473 474 476 477
 481 485 489 498 500 501 506 507 510 511 512 519 522 523 526 536 537 544
 545 547 556 557 558 560 561 562 565 569 570 571 575 577 581 584 593 599
 607 609 611 613 621 623 624 626 627 633 635 638 639 641 642 645 648 649
 652 653 656 658 662 663 666 668 675 678 679 680 684 685 686 693 694 695
 697 700 705 706 708 712 713 714 715 717 718 722 724 725 727 728 730 734
 735 73

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  58  65  66  68  69  72  74  75  78  81  85  91
  95  98 102 104 106 107 108 112 114 116 117 118 119 123 124 125 126 127
 128 139 148 151 152 156 159 162 170 171 172 175 177 181 183 186 187 189
 196 202 203 210 211 212 214 215 216 220 221 222 223 225 228 229 232 236
 237 242 244 245 251 252 254 258 260 265 266 272 273 274 275 276 277 284
 287 289 293 294 296 297 300 301 303 304 315 323 328 329 330 332 337 338
 340 342 344 346 348 351 354 355 359 361 362 364 370 376 380 384 387 389
 392 394 395 396 398 401 402 404 407 408 412 419 421 422 423 424 430 431
 432 433 449 454 456 458 459 462 469 473 474 475 476 481 485 489 498 500
 506 507 510 512 522 526 528 540 544 545 547 549 556 557 558 560 561 565
 570 575 584 590 599 605 607 609 611 613 621 623 624 626 627 635 638 639
 641 642 643 645 649 652 653 655 656 658 659 662 663 667 668 675 678 679
 680 683 685 692 697 700 701 704 706 707 708 712 713 714 715 717 718 719
 722 72

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  50  59  63  65  66  68  69  72  74  75  78  84
  85  91  94  95  98 102 106 107 108 112 114 118 119 123 125 128 135 139
 148 149 150 151 152 156 157 159 160 162 170 171 172 175 180 183 186 187
 189 196 201 202 203 208 211 214 220 221 222 225 229 230 237 238 242 243
 245 251 252 259 263 264 265 266 269 272 273 274 275 277 278 284 287 289
 291 293 294 296 300 301 303 305 315 323 329 330 337 338 340 342 344 351
 355 359 361 362 364 365 370 372 376 384 387 392 394 395 398 401 408 409
 410 419 421 424 426 430 431 433 443 449 453 454 456 458 459 461 464 469
 473 474 476 479 481 485 489 495 496 498 500 505 506 507 510 512 515 522
 539 544 545 546 547 548 549 556 557 558 560 561 565 570 574 575 579 580
 584 590 591 593 598 599 602 603 606 607 608 609 611 613 614 615 621 623
 624 626 627 631 632 634 635 638 639 641 642 645 649 652 653 656 657 658
 662 663 664 668 669 671 672 675 678 679 680 685 687 697 700 702 706 708
 709 71

  if LooseVersion(joblib_version) < '0.12':
  42  43  45  46  47  49  65  66  68  69  72  73  74  75  77  78  85  86
  90  91  95  96  97  98 102 106 107 109 112 114 118 119 123 125 128 129
 139 146 147 148 151 152 156 158 159 160 162 170 171 175 176 178 179 183
 186 187 188 189 190 192 196 202 203 207 208 210 211 214 219 220 221 222
 224 225 229 237 239 242 245 251 252 259 261 265 266 272 273 274 275 277
 284 287 289 293 294 296 300 301 303 308 315 316 318 323 329 330 337 338
 340 341 342 344 351 355 359 360 361 362 364 370 376 381 384 385 387 390
 392 393 394 395 398 401 407 409 411 419 420 421 424 430 431 433 448 449
 454 456 457 458 459 463 469 470 472 473 474 476 481 485 489 494 498 499
 500 506 507 510 512 519 522 534 536 543 544 545 547 550 556 557 558 560
 561 565 570 572 575 576 581 584 585 588 592 597 599 606 607 609 610 611
 613 617 621 623 624 626 627 635 638 639 641 642 643 645 648 649 652 653
 654 656 658 662 663 665 668 672 673 674 675 678 679 680 685 697 698 700
 706 70

  if LooseVersion(joblib_version) < '0.12':
  42  45  46  47  49  50  54  65  66  68  69  72  74  75  78  83  85  91
  92  95  98 102 106 107 112 114 118 119 123 125 128 133 139 140 148 149
 151 152 154 156 159 162 164 170 171 175 176 178 183 186 187 189 194 196
 202 203 205 211 212 214 215 220 221 222 225 229 231 237 238 240 242 244
 245 251 252 253 263 265 266 271 272 273 274 275 277 281 284 286 287 289
 290 291 293 294 296 300 301 302 303 308 314 315 321 323 324 329 330 334
 337 338 340 342 344 351 355 359 361 362 364 370 373 376 377 384 385 387
 390 392 393 394 395 397 398 401 402 415 418 419 421 424 430 431 432 433
 436 446 449 454 456 458 459 469 473 474 475 476 481 483 485 486 487 489
 498 500 506 507 510 511 512 513 522 525 527 529 532 538 543 544 545 547
 556 557 558 560 561 564 565 570 573 575 580 584 585 599 601 602 607 609
 611 613 621 622 623 624 626 627 632 635 638 639 641 642 645 649 652 653
 656 658 659 662 663 665 666 668 675 678 679 680 681 682 685 686 691 692
 697 70

  44  45  46  47  49  61  65  66  68  69  72  74  75  76  78  80  85  88
  91  95  98 102 106 107 112 114 118 119 123 125 128 133 139 148 151 152
 153 156 159 162 164 170 171 175 183 186 187 189 196 197 198 200 202 203
 204 211 214 218 219 220 221 222 225 229 234 237 242 245 251 252 256 258
 265 266 272 273 274 275 276 277 283 284 287 289 293 294 296 300 301 302
 303 307 310 313 315 316 317 323 325 329 330 337 338 339 340 342 344 351
 355 359 361 362 364 365 370 373 376 384 387 392 394 395 398 401 415 416
 419 421 423 424 430 431 433 442 449 454 456 458 459 469 473 474 476 477
 481 485 489 498 500 501 506 507 510 511 512 519 522 523 526 536 537 544
 545 547 556 557 558 560 561 562 565 569 570 571 575 577 581 584 593 599
 607 609 611 613 621 623 624 626 627 633 635 638 639 641 642 645 648 649
 652 653 656 658 662 663 666 668 675 678 679 680 684 685 686 693 694 695
 697 700 705 706 708 712 713 714 715 717 718 722 724 725 727 728 730 734
 735 737 739 741 745 747 752 753 757 760 763 766 76

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  58  65  66  68  69  72  74  75  78  81  85  91
  95  98 102 104 106 107 108 112 114 116 117 118 119 123 124 125 126 127
 128 139 148 151 152 156 159 162 170 171 172 175 177 181 183 186 187 189
 196 202 203 210 211 212 214 215 216 220 221 222 223 225 228 229 232 236
 237 242 244 245 251 252 254 258 260 265 266 272 273 274 275 276 277 284
 287 289 293 294 296 297 300 301 303 304 315 323 328 329 330 332 337 338
 340 342 344 346 348 351 354 355 359 361 362 364 370 376 380 384 387 389
 392 394 395 396 398 401 402 404 407 408 412 419 421 422 423 424 430 431
 432 433 449 454 456 458 459 462 469 473 474 475 476 481 485 489 498 500
 506 507 510 512 522 526 528 540 544 545 547 549 556 557 558 560 561 565
 570 575 584 590 599 605 607 609 611 613 621 623 624 626 627 635 638 639
 641 642 643 645 649 652 653 655 656 658 659 662 663 667 668 675 678 679
 680 683 685 692 697 700 701 704 706 707 708 712 713 714 715 717 718 719
 722 72

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  50  59  63  65  66  68  69  72  74  75  78  84
  85  91  94  95  98 102 106 107 108 112 114 118 119 123 125 128 135 139
 148 149 150 151 152 156 157 159 160 162 170 171 172 175 180 183 186 187
 189 196 201 202 203 208 211 214 220 221 222 225 229 230 237 238 242 243
 245 251 252 259 263 264 265 266 269 272 273 274 275 277 278 284 287 289
 291 293 294 296 300 301 303 305 315 323 329 330 337 338 340 342 344 351
 355 359 361 362 364 365 370 372 376 384 387 392 394 395 398 401 408 409
 410 419 421 424 426 430 431 433 443 449 453 454 456 458 459 461 464 469
 473 474 476 479 481 485 489 495 496 498 500 505 506 507 510 512 515 522
 539 544 545 546 547 548 549 556 557 558 560 561 565 570 574 575 579 580
 584 590 591 593 598 599 602 603 606 607 608 609 611 613 614 615 621 623
 624 626 627 631 632 634 635 638 639 641 642 645 649 652 653 656 657 658
 662 663 664 668 669 671 672 675 678 679 680 685 687 697 700 702 706 708
 709 71

  if LooseVersion(joblib_version) < '0.12':
  42  43  45  46  47  49  65  66  68  69  72  73  74  75  77  78  85  86
  90  91  95  96  97  98 102 106 107 109 112 114 118 119 123 125 128 129
 139 146 147 148 151 152 156 158 159 160 162 170 171 175 176 178 179 183
 186 187 188 189 190 192 196 202 203 207 208 210 211 214 219 220 221 222
 224 225 229 237 239 242 245 251 252 259 261 265 266 272 273 274 275 277
 284 287 289 293 294 296 300 301 303 308 315 316 318 323 329 330 337 338
 340 341 342 344 351 355 359 360 361 362 364 370 376 381 384 385 387 390
 392 393 394 395 398 401 407 409 411 419 420 421 424 430 431 433 448 449
 454 456 457 458 459 463 469 470 472 473 474 476 481 485 489 494 498 499
 500 506 507 510 512 519 522 534 536 543 544 545 547 550 556 557 558 560
 561 565 570 572 575 576 581 584 585 588 592 597 599 606 607 609 610 611
 613 617 621 623 624 626 627 635 638 639 641 642 643 645 648 649 652 653
 654 656 658 662 663 665 668 672 673 674 675 678 679 680 685 697 698 700
 706 70

  if LooseVersion(joblib_version) < '0.12':
  42  45  46  47  49  50  54  65  66  68  69  72  74  75  78  83  85  91
  92  95  98 102 106 107 112 114 118 119 123 125 128 133 139 140 148 149
 151 152 154 156 159 162 164 170 171 175 176 178 183 186 187 189 194 196
 202 203 205 211 212 214 215 220 221 222 225 229 231 237 238 240 242 244
 245 251 252 253 263 265 266 271 272 273 274 275 277 281 284 286 287 289
 290 291 293 294 296 300 301 302 303 308 314 315 321 323 324 329 330 334
 337 338 340 342 344 351 355 359 361 362 364 370 373 376 377 384 385 387
 390 392 393 394 395 397 398 401 402 415 418 419 421 424 430 431 432 433
 436 446 449 454 456 458 459 469 473 474 475 476 481 483 485 486 487 489
 498 500 506 507 510 511 512 513 522 525 527 529 532 538 543 544 545 547
 556 557 558 560 561 564 565 570 573 575 580 584 585 599 601 602 607 609
 611 613 621 622 623 624 626 627 632 635 638 639 641 642 645 649 652 653
 656 658 659 662 663 665 666 668 675 678 679 680 681 682 685 686 691 692
 697 70

  if LooseVersion(joblib_version) < '0.12':
  44  45  46  47  49  61  65  66  68  69  72  74  75  76  78  80  85  88
  91  95  98 102 106 107 112 114 118 119 123 125 128 133 139 148 151 152
 153 156 159 162 164 170 171 175 183 186 187 189 196 197 198 200 202 203
 204 211 214 218 219 220 221 222 225 229 234 237 242 245 251 252 256 258
 265 266 272 273 274 275 276 277 283 284 287 289 293 294 296 300 301 302
 303 307 310 313 315 316 317 323 325 329 330 337 338 339 340 342 344 351
 355 359 361 362 364 365 370 373 376 384 387 392 394 395 398 401 415 416
 419 421 423 424 430 431 433 442 449 454 456 458 459 469 473 474 476 477
 481 485 489 498 500 501 506 507 510 511 512 519 522 523 526 536 537 544
 545 547 556 557 558 560 561 562 565 569 570 571 575 577 581 584 593 599
 607 609 611 613 621 623 624 626 627 633 635 638 639 641 642 645 648 649
 652 653 656 658 662 663 666 668 675 678 679 680 684 685 686 693 694 695
 697 700 705 706 708 712 713 714 715 717 718 722 724 725 727 728 730 734
 735 73

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  58  65  66  68  69  72  74  75  78  81  85  91
  95  98 102 104 106 107 108 112 114 116 117 118 119 123 124 125 126 127
 128 139 148 151 152 156 159 162 170 171 172 175 177 181 183 186 187 189
 196 202 203 210 211 212 214 215 216 220 221 222 223 225 228 229 232 236
 237 242 244 245 251 252 254 258 260 265 266 272 273 274 275 276 277 284
 287 289 293 294 296 297 300 301 303 304 315 323 328 329 330 332 337 338
 340 342 344 346 348 351 354 355 359 361 362 364 370 376 380 384 387 389
 392 394 395 396 398 401 402 404 407 408 412 419 421 422 423 424 430 431
 432 433 449 454 456 458 459 462 469 473 474 475 476 481 485 489 498 500
 506 507 510 512 522 526 528 540 544 545 547 549 556 557 558 560 561 565
 570 575 584 590 599 605 607 609 611 613 621 623 624 626 627 635 638 639
 641 642 643 645 649 652 653 655 656 658 659 662 663 667 668 675 678 679
 680 683 685 692 697 700 701 704 706 707 708 712 713 714 715 717 718 719
 722 72

  if LooseVersion(joblib_version) < '0.12':
  41  42  45  46  47  49  50  59  63  65  66  68  69  72  74  75  78  84
  85  91  94  95  98 102 106 107 108 112 114 118 119 123 125 128 135 139
 148 149 150 151 152 156 157 159 160 162 170 171 172 175 180 183 186 187
 189 196 201 202 203 208 211 214 220 221 222 225 229 230 237 238 242 243
 245 251 252 259 263 264 265 266 269 272 273 274 275 277 278 284 287 289
 291 293 294 296 300 301 303 305 315 323 329 330 337 338 340 342 344 351
 355 359 361 362 364 365 370 372 376 384 387 392 394 395 398 401 408 409
 410 419 421 424 426 430 431 433 443 449 453 454 456 458 459 461 464 469
 473 474 476 479 481 485 489 495 496 498 500 505 506 507 510 512 515 522
 539 544 545 546 547 548 549 556 557 558 560 561 565 570 574 575 579 580
 584 590 591 593 598 599 602 603 606 607 608 609 611 613 614 615 621 623
 624 626 627 631 632 634 635 638 639 641 642 645 649 652 653 656 657 658
 662 663 664 668 669 671 672 675 678 679 680 685 687 697 700 702 706 708
 709 71

  if LooseVersion(joblib_version) < '0.12':
  42  43  45  46  47  49  65  66  68  69  72  73  74  75  77  78  85  86
  90  91  95  96  97  98 102 106 107 109 112 114 118 119 123 125 128 129
 139 146 147 148 151 152 156 158 159 160 162 170 171 175 176 178 179 183
 186 187 188 189 190 192 196 202 203 207 208 210 211 214 219 220 221 222
 224 225 229 237 239 242 245 251 252 259 261 265 266 272 273 274 275 277
 284 287 289 293 294 296 300 301 303 308 315 316 318 323 329 330 337 338
 340 341 342 344 351 355 359 360 361 362 364 370 376 381 384 385 387 390
 392 393 394 395 398 401 407 409 411 419 420 421 424 430 431 433 448 449
 454 456 457 458 459 463 469 470 472 473 474 476 481 485 489 494 498 499
 500 506 507 510 512 519 522 534 536 543 544 545 547 550 556 557 558 560
 561 565 570 572 575 576 581 584 585 588 592 597 599 606 607 609 610 611
 613 617 621 623 624 626 627 635 638 639 641 642 643 645 648 649 652 653
 654 656 658 662 663 665 668 672 673 674 675 678 679 680 685 697 698 700
 706 70

  if LooseVersion(joblib_version) < '0.12':
  42  45  46  47  49  50  54  65  66  68  69  72  74  75  78  83  85  91
  92  95  98 102 106 107 112 114 118 119 123 125 128 133 139 140 148 149
 151 152 154 156 159 162 164 170 171 175 176 178 183 186 187 189 194 196
 202 203 205 211 212 214 215 220 221 222 225 229 231 237 238 240 242 244
 245 251 252 253 263 265 266 271 272 273 274 275 277 281 284 286 287 289
 290 291 293 294 296 300 301 302 303 308 314 315 321 323 324 329 330 334
 337 338 340 342 344 351 355 359 361 362 364 370 373 376 377 384 385 387
 390 392 393 394 395 397 398 401 402 415 418 419 421 424 430 431 432 433
 436 446 449 454 456 458 459 469 473 474 475 476 481 483 485 486 487 489
 498 500 506 507 510 511 512 513 522 525 527 529 532 538 543 544 545 547
 556 557 558 560 561 564 565 570 573 575 580 584 585 599 601 602 607 609
 611 613 621 622 623 624 626 627 632 635 638 639 641 642 645 649 652 653
 656 658 659 662 663 665 666 668 675 678 679 680 681 682 685 686 691 692
 697 70

  if LooseVersion(joblib_version) < '0.12':
  44  45  46  47  49  61  65  66  68  69  72  74  75  76  78  80  85  88
  91  95  98 102 106 107 112 114 118 119 123 125 128 133 139 148 151 152
 153 156 159 162 164 170 171 175 183 186 187 189 196 197 198 200 202 203
 204 211 214 218 219 220 221 222 225 229 234 237 242 245 251 252 256 258
 265 266 272 273 274 275 276 277 283 284 287 289 293 294 296 300 301 302
 303 307 310 313 315 316 317 323 325 329 330 337 338 339 340 342 344 351
 355 359 361 362 364 365 370 373 376 384 387 392 394 395 398 401 415 416
 419 421 423 424 430 431 433 442 449 454 456 458 459 469 473 474 476 477
 481 485 489 498 500 501 506 507 510 511 512 519 522 523 526 536 537 544
 545 547 556 557 558 560 561 562 565 569 570 571 575 577 581 584 593 599
 607 609 611 613 621 623 624 626 627 633 635 638 639 641 642 645 648 649
 652 653 656 658 662 663 666 668 675 678 679 680 684 685 686 693 694 695
 697 700 705 706 708 712 713 714 715 717 718 722 724 725 727 728 730 734
 735 73

GridSearchCV(cv=5, error_score='raise-deprecating',
             estimator=Pipeline(memory=None,
                                steps=[('feature_selection',
                                        SelectKBest(k=10,
                                                    score_func=<function f_classif at 0x0000013139D29C18>)),
                                       ('boosting',
                                        XGBRegressor(base_score=None,
                                                     booster=None,
                                                     callbacks=None,
                                                     colsample_bylevel=None,
                                                     colsample_bynode=None,
                                                     colsample_bytree=None,
                                                     early_stopping_rounds=None,
                                                     enable_c...
                                          

In [8]:
# Get the best parameters and estimator
best_params = grid_search.best_params_
best_estimator = grid_search.best_estimator_

In [9]:
# Fit the best estimator on the training data
best_estimator.fit(X_train, y_train)


  if LooseVersion(joblib_version) < '0.12':
  45  46  47  49  65  66  68  69  72  74  75  78  85  91  95  98 102 106
 107 112 114 118 119 123 125 128 139 148 151 152 156 159 162 170 171 175
 183 186 187 189 196 202 203 211 214 220 221 222 225 229 237 242 245 251
 252 265 266 272 273 274 275 277 284 287 289 293 294 296 300 301 303 315
 323 329 330 337 338 340 342 344 351 355 359 361 362 364 370 376 384 387
 392 394 395 398 401 419 421 424 430 431 433 449 454 456 458 459 469 473
 474 476 481 485 489 498 500 506 507 510 512 522 544 545 547 556 557 558
 560 561 565 570 575 584 599 607 609 611 613 621 623 624 626 627 635 638
 639 641 642 645 649 652 653 656 658 662 663 668 675 678 679 680 685 697
 700 706 708 712 713 714 715 717 718 722 724 727 728 730 734 735 737 739
 741 745 747 753 757 763 768 769 775 786 788 789 790 794 800 804 806 807
 808 810 814 819 820 821 832 836 841 843 846 847 848 849 850 853 857 860
 863 864 865 875 876 879 880 882 888 891 893 895 898 899 900 901 902 903
 904 90

Pipeline(memory=None,
         steps=[('feature_selection',
                 SelectKBest(k=2,
                             score_func=<function f_classif at 0x0000013139D29C18>)),
                ('boosting',
                 XGBRegressor(base_score=0.5, booster='gbtree', callbacks=None,
                              colsample_bylevel=1, colsample_bynode=1,
                              colsample_bytree=1, early_stopping_rounds=None,
                              enable_categorical=False, eval_metric=None,
                              gamma=0, gpu_id=-1, grow_policy='depthwise',
                              importance_type=None, interaction_constraints='',
                              learning_rate=0.2, max_bin=256,
                              max_cat_to_onehot=4, max_delta_step=0,
                              max_depth=6, max_leaves=0, min_child_weight=1,
                              missing=nan, monotone_constraints='()',
                              n_estimators=100, n_jobs=

In [10]:

# Evaluate the model
r2_best_xgb = r2_score(y_test, best_estimator.predict(X_test))
print("Best XGBoost R-squared:", r2_best_xgb)

Best XGBoost R-squared: -4.7450412021809996e-07
