#Run full pipeline to transform the data

NIRAV_RAJ · December 17, 2020, 5:21pm

#Run full pipeline to transform the data
X_test_prepared = full_pipeline.transform(X_test)
final_predictions = final_model.predict(X_test_prepared)

KeyError Traceback (most recent call last)
in
1 #Run full pipeline to transform the data
----> 2 X_test_prepared = full_pipeline.transform(X_test)
3 final_predictions = final_model.predict(X_test_prepared)
4

/usr/local/anaconda/lib/python3.6/site-packages/sklearn/pipeline.py in transform(self, X)
982 Xs = Parallel(n_jobs=self.n_jobs)(
983 delayed(_transform_one)(trans, X, None, weight)
–> 984 for name, trans, weight in self._iter())
985 if not Xs:
986 # All transformers are None

/usr/local/anaconda/lib/python3.6/site-packages/joblib/parallel.py in call(self, iterable)
919 # remaining jobs.
920 self._iterating = False
–> 921 if self.dispatch_one_batch(iterator):
922 self._iterating = self._original_iterator is not None
923

/usr/local/anaconda/lib/python3.6/site-packages/joblib/parallel.py in dispatch_one_batch(self, iterator)
757 return False
758 else:
–> 759 self._dispatch(tasks)
760 return True
761

/usr/local/anaconda/lib/python3.6/site-packages/joblib/parallel.py in _dispatch(self, batch)
714 with self._lock:
715 job_idx = len(self._jobs)
–> 716 job = self._backend.apply_async(batch, callback=cb)
717 # A job can complete so quickly than its callback is
718 # called before we get here, causing self._jobs to

/usr/local/anaconda/lib/python3.6/site-packages/joblib/_parallel_backends.py in apply_async(self, func, callback)
180 def apply_async(self, func, callback=None):
181 “”“Schedule a func to be run”""
–> 182 result = ImmediateResult(func)
183 if callback:
184 callback(result)

/usr/local/anaconda/lib/python3.6/site-packages/joblib/_parallel_backends.py in init(self, batch)
547 # Don’t delay the application, to avoid keeping the input
548 # arguments in memory
–> 549 self.results = batch()
550
551 def get(self):

/usr/local/anaconda/lib/python3.6/site-packages/joblib/parallel.py in call(self)
223 with parallel_backend(self._backend, n_jobs=self._n_jobs):
224 return [func(*args, **kwargs)
–> 225 for func, args, kwargs in self.items]
226
227 def len(self):

/usr/local/anaconda/lib/python3.6/site-packages/joblib/parallel.py in (.0)
223 with parallel_backend(self._backend, n_jobs=self._n_jobs):
224 return [func(*args, **kwargs)
–> 225 for func, args, kwargs in self.items]
226
227 def len(self):

/usr/local/anaconda/lib/python3.6/site-packages/sklearn/pipeline.py in _transform_one(transformer, X, y, weight, **fit_params)
705
706 def _transform_one(transformer, X, y, weight, **fit_params):
–> 707 res = transformer.transform(X)
708 # if we have a weight for this transformer, multiply output
709 if weight is None:

/usr/local/anaconda/lib/python3.6/site-packages/sklearn/pipeline.py in _transform(self, X)
555 Xt = X
556 for _, _, transform in self._iter():
–> 557 Xt = transform.transform(Xt)
558 return Xt
559

in transform(self, X)
9 return self
10 def transform(self, X):
—> 11 return X[self.attribute_names].values

/usr/local/anaconda/lib/python3.6/site-packages/pandas/core/frame.py in getitem(self, key)
2984 if is_iterator(key):
2985 key = list(key)
-> 2986 indexer = self.loc._convert_to_indexer(key, axis=1, raise_missing=True)
2987
2988 # take() does not accept boolean indexers

/usr/local/anaconda/lib/python3.6/site-packages/pandas/core/indexing.py in _convert_to_indexer(self, obj, axis, is_setter, raise_missing)
1283 # When setting, missing keys are not allowed, even with .loc:
1284 kwargs = {“raise_missing”: True if is_setter else raise_missing}
-> 1285 return self._get_listlike_indexer(obj, axis, **kwargs)[1]
1286 else:
1287 try:

/usr/local/anaconda/lib/python3.6/site-packages/pandas/core/indexing.py in _get_listlike_indexer(self, key, axis, raise_missing)
1090
1091 self._validate_read_indexer(
-> 1092 keyarr, indexer, o._get_axis_number(axis), raise_missing=raise_missing
1093 )
1094 return keyarr, indexer

/usr/local/anaconda/lib/python3.6/site-packages/pandas/core/indexing.py in _validate_read_indexer(self, key, indexer, axis, raise_missing)
1183 if not (self.name == “loc” and not raise_missing):
1184 not_found = list(set(key) - set(ax))
-> 1185 raise KeyError("{} not in index".format(not_found))
1186
1187 # we skip the warning on Categorical/Interval

KeyError: “[‘median_house_value’] not in index”

How can i fix this??

Please reply.

sgiri · December 18, 2020, 2:12am

Please provide some context where you are facing this issue.

From the error, it seems that the column ‘median_house_value’ does not exist.

NIRAV_RAJ · December 18, 2020, 8:02am

NIRAV_RAJ · December 18, 2020, 8:03am

NIRAV_RAJ · December 18, 2020, 8:03am

Opera Snapshot_2020-12-18_132946_jupyter.e.cloudxlab.com984×668 42.6 KB

NIRAV_RAJ · December 18, 2020, 8:04am

Opera Snapshot_2020-12-18_133036_jupyter.e.cloudxlab.com984×668 42 KB

NIRAV_RAJ · December 18, 2020, 8:04am

Opera Snapshot_2020-12-18_133207_jupyter.e.cloudxlab.com984×668 42.7 KB

NIRAV_RAJ · December 18, 2020, 8:05am

please tell me how can i fix it??

sgiri · December 19, 2020, 1:18pm

Please go thru the code and understand it.

At some point the “median_house_value” is dropped because we don’t want it in output.

Later, we created “full_pipeline” to do the transformations which included the dropping of the column “median_house_value”. So, probably, you will have to load the X_test again and process it using the pipeline instead of passing the already clean/processing X_test.

NIRAV_RAJ · December 19, 2020, 3:48pm

I did not understand it.

You did not create new.

I did copy and paste from your github.

How can i fix it now??

Please tell me the full code.

sgiri · December 20, 2020, 8:02am

Please help me understand which not book are you following. Please let me know the filename or the link to it.

NIRAV_RAJ · December 22, 2020, 4:44pm

I am sorry for late reply
I am not follwoing any books only your lectures I am listening.

Please give me full code otherwise i will not be able to complete my last code.

NIRAV_RAJ · December 22, 2020, 4:47pm

can you please tell me where which X_test you are taking this or other

As your code which is on the git hub i followed but that didn’t work

Please tell me the code

Please tell me which X_test you are taking in which “median_house_value_” exist??

Please

NIRAV_RAJ · December 22, 2020, 4:51pm

You dropped column from X_test and then again you created X_test_prepared using that X_test which you dropped “median_house_value”

Then why it is not taking

Please tell me how can i get that “median_house_value”

sgiri · December 22, 2020, 6:32pm

I was asking which notebook are you following.

NIRAV_RAJ · December 23, 2020, 3:44pm

I am following github notebooks
[ machine_learning/end_to_end_project.ipynb](https://github.com/cloudxlab/ml/blob/master/machine_learning/end_to_end_project.
It is your notebooks not mine.

NIRAV_RAJ · December 23, 2020, 4:01pm

notebook i did not understand !

I am doing it on python 3 on cloudxlab

NIRAV_RAJ · December 24, 2020, 3:50pm

Can you please tell me notebook meaning!

NIRAV_RAJ · December 24, 2020, 3:53pm

which notebook means what ??

NIRAV_RAJ · December 24, 2020, 3:54pm

Please elaborate ??
i Did not understand

Please reply.