[CARBONDATA-3174] Fix trailing space issue with varchar column for SDK #2988

Shubh18s · 2018-12-14T09:37:12Z

What was the issue?
After doing SDK Write, Select * was failing for 'long_string_columns' with trailing space.

What has been changed?
Removed the trailing space in ColumnName.

Be sure to do all of the following checklist to help us incorporate
your contribution quickly and easily:

Any interfaces changed?
Any backward compatibility impacted?
Document update required?
Testing done
Added a test case.
For large changes, please consider breaking it into sub-tasks under an umbrella JIRA.

CarbonDataQA · 2018-12-14T09:40:07Z

Can one of the admins verify this patch?

brijoobopanna · 2018-12-14T11:29:07Z

add to whitelist

brijoobopanna · 2018-12-14T11:29:14Z

retest this please

CarbonDataQA · 2018-12-14T11:39:09Z

Build Success with Spark 2.1.0, Please check CI http://136.243.101.176:8080/job/ApacheCarbonPRBuilder2.1/1761/

CarbonDataQA · 2018-12-14T12:42:54Z

Build Success with Spark 2.2.1, Please check CI http://95.216.28.178:8080/job/ApacheCarbonPRBuilder1/1972/

CarbonDataQA · 2018-12-14T12:58:14Z

Build Success with Spark 2.3.2, Please check CI http://136.243.101.176:8080/job/carbondataprbuilder2.3/10020/

qiuchenjian · 2018-12-15T02:31:24Z

...cala/org/apache/carbondata/spark/testsuite/createTable/TestNonTransactionalCarbonTable.scala

+      s"""CREATE TABLE test using carbon options('long_string_columns'='subject,messagebody')
+         |LOCATION '$writerPath'"""
+        .stripMargin)
+    sql("select * from test").show()


Why is this test case not checking the correctness of the results? Such as checkAnswer ， assert and so on

CarbonDataQA · 2018-12-17T06:19:01Z

Build Success with Spark 2.1.0, Please check CI http://136.243.101.176:8080/job/ApacheCarbonPRBuilder2.1/1786/

CarbonDataQA · 2018-12-17T07:18:51Z

Build Success with Spark 2.3.2, Please check CI http://136.243.101.176:8080/job/carbondataprbuilder2.3/10046/

CarbonDataQA · 2018-12-17T07:40:59Z

Build Failed with Spark 2.2.1, Please check CI http://95.216.28.178:8080/job/ApacheCarbonPRBuilder1/1998/

Shubh18s · 2018-12-17T08:43:12Z

retest this please

CarbonDataQA · 2018-12-17T08:53:54Z

Build Success with Spark 2.1.0, Please check CI http://136.243.101.176:8080/job/ApacheCarbonPRBuilder2.1/1793/

CarbonDataQA · 2018-12-17T10:06:41Z

Build Success with Spark 2.3.2, Please check CI http://136.243.101.176:8080/job/carbondataprbuilder2.3/10053/

CarbonDataQA · 2018-12-17T10:22:33Z

Build Success with Spark 2.2.1, Please check CI http://95.216.28.178:8080/job/ApacheCarbonPRBuilder1/2005/

ajantha-bhat · 2018-12-17T14:02:54Z

store/sdk/src/main/java/org/apache/carbondata/sdk/file/Field.java

@@ -55,7 +55,7 @@
   * @param type datatype of field, specified in strings.
   */
  public Field(String name, String type) {
-    this.name = name;
+    this.name = name.toLowerCase().trim();


CarbonWriterBuilder.updateSchemaFields() is already converting to lowercase, just add trim in that method. No need to handle for each here.

ajantha-bhat · 2018-12-17T14:12:49Z

...cala/org/apache/carbondata/spark/testsuite/createTable/TestNonTransactionalCarbonTable.scala

@@ -2490,6 +2490,54 @@ class TestNonTransactionalCarbonTable extends QueryTest with BeforeAndAfterAll {
    FileUtils.deleteDirectory(new File(writerPath))
  }

+  test("check varchar with trailing space") {


No need to duplicate test cases. In the existing varchar columns test case, add a trailing space to one of the columns.

besides, this is for varchar columns, why not update the code there?

ajantha-bhat · 2018-12-17T14:13:43Z

@Shubh18s : why for only varchar columns ? how it was handled other columns ? I guess this problem is there for other columns also

CarbonDataQA · 2018-12-17T14:49:03Z

Build Success with Spark 2.1.0, Please check CI http://136.243.101.176:8080/job/ApacheCarbonPRBuilder2.1/1801/

CarbonDataQA · 2018-12-17T15:54:25Z

Build Success with Spark 2.2.1, Please check CI http://95.216.28.178:8080/job/ApacheCarbonPRBuilder1/2013/

CarbonDataQA · 2018-12-17T15:57:16Z

Build Success with Spark 2.3.2, Please check CI http://136.243.101.176:8080/job/carbondataprbuilder2.3/10062/

ajantha-bhat · 2018-12-18T05:15:37Z

@Shubh18s : I have checked the code,
all the column names are stored without trim in SDK. But long_string_columns table properties is having trim. column name has string without trim but properties have string with trim. Hence the schema mismatch.

After this change, sort_columns and invertedIndexFor are affected.
As CarbonWriterBuilder.sortBy() is exposed to user, here also trim is not there as per previous code. so add trim() here also. similar changes in CarbonWriterBuilder.invertedIndexFor()

ajantha-bhat · 2018-12-18T06:46:47Z

store/sdk/src/main/java/org/apache/carbondata/sdk/file/CarbonWriterBuilder.java

@@ -747,7 +747,7 @@ private Schema updateSchemaFields(Schema schema, Set<String> longStringColumns)
    Field[] fields =  schema.getFields();
    for (int i = 0; i < fields.length; i++) {
      if (fields[i] != null) {
-        fields[i].updateNameToLowerCase();
+        //fields[i].updateName();


remove this

CarbonDataQA · 2018-12-18T06:48:51Z

Build Success with Spark 2.1.0, Please check CI http://136.243.101.176:8080/job/ApacheCarbonPRBuilder2.1/1814/

CarbonDataQA · 2018-12-18T06:59:54Z

Build Success with Spark 2.1.0, Please check CI http://136.243.101.176:8080/job/ApacheCarbonPRBuilder2.1/1815/

CarbonDataQA · 2018-12-18T08:04:08Z

Build Success with Spark 2.2.1, Please check CI http://95.216.28.178:8080/job/ApacheCarbonPRBuilder1/2025/

CarbonDataQA · 2018-12-18T08:11:25Z

Build Success with Spark 2.3.2, Please check CI http://136.243.101.176:8080/job/carbondataprbuilder2.3/10074/

ajantha-bhat · 2018-12-18T08:22:54Z

LGTM

kunal642 · 2018-12-18T11:00:32Z

LGTM

What was the issue? After doing SDK Write, Select * was failing for 'long_string_columns' with trailing space. What has been changed? Removed the trailing space in ColumnName. This closes #2988

What was the issue? After doing SDK Write, Select * was failing for 'long_string_columns' with trailing space. What has been changed? Removed the trailing space in ColumnName. This closes apache#2988

Shubh18s force-pushed the master branch from 7a5d26e to f04ad86 Compare December 14, 2018 09:45

qiuchenjian reviewed Dec 15, 2018

View reviewed changes

Shubh18s force-pushed the master branch from f04ad86 to 45520c1 Compare December 17, 2018 06:06

ajantha-bhat reviewed Dec 17, 2018

View reviewed changes

Shubh18s force-pushed the master branch from 45520c1 to 5b13c15 Compare December 17, 2018 14:37

Shubh18s force-pushed the master branch from 5b13c15 to 7edeeda Compare December 18, 2018 06:37

ajantha-bhat reviewed Dec 18, 2018

View reviewed changes

[CARBONDATA-3174]varchar column trailing space issue fixed

ee9d109

Shubh18s force-pushed the master branch from 7edeeda to ee9d109 Compare December 18, 2018 06:49

asfgit closed this in f822540 Dec 18, 2018

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[CARBONDATA-3174] Fix trailing space issue with varchar column for SDK #2988

[CARBONDATA-3174] Fix trailing space issue with varchar column for SDK #2988

Shubh18s commented Dec 14, 2018

CarbonDataQA commented Dec 14, 2018

brijoobopanna commented Dec 14, 2018

brijoobopanna commented Dec 14, 2018

CarbonDataQA commented Dec 14, 2018

CarbonDataQA commented Dec 14, 2018

CarbonDataQA commented Dec 14, 2018

qiuchenjian Dec 15, 2018

Shubh18s Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

Shubh18s commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

ajantha-bhat Dec 17, 2018

ajantha-bhat Dec 17, 2018

xuchuanyin Dec 18, 2018

ajantha-bhat commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

ajantha-bhat commented Dec 18, 2018

ajantha-bhat Dec 18, 2018

CarbonDataQA commented Dec 18, 2018

CarbonDataQA commented Dec 18, 2018

CarbonDataQA commented Dec 18, 2018

CarbonDataQA commented Dec 18, 2018

ajantha-bhat commented Dec 18, 2018

kunal642 commented Dec 18, 2018

[CARBONDATA-3174] Fix trailing space issue with varchar column for SDK #2988

[CARBONDATA-3174] Fix trailing space issue with varchar column for SDK #2988

Conversation

Shubh18s commented Dec 14, 2018

CarbonDataQA commented Dec 14, 2018

brijoobopanna commented Dec 14, 2018

brijoobopanna commented Dec 14, 2018

CarbonDataQA commented Dec 14, 2018

CarbonDataQA commented Dec 14, 2018

CarbonDataQA commented Dec 14, 2018

qiuchenjian Dec 15, 2018

Choose a reason for hiding this comment

Shubh18s Dec 17, 2018

Choose a reason for hiding this comment

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

Shubh18s commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

ajantha-bhat Dec 17, 2018

Choose a reason for hiding this comment

ajantha-bhat Dec 17, 2018

Choose a reason for hiding this comment

xuchuanyin Dec 18, 2018

Choose a reason for hiding this comment

ajantha-bhat commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

CarbonDataQA commented Dec 17, 2018

ajantha-bhat commented Dec 18, 2018

ajantha-bhat Dec 18, 2018

Choose a reason for hiding this comment

CarbonDataQA commented Dec 18, 2018

CarbonDataQA commented Dec 18, 2018

CarbonDataQA commented Dec 18, 2018

CarbonDataQA commented Dec 18, 2018

ajantha-bhat commented Dec 18, 2018

kunal642 commented Dec 18, 2018