Mercari Price Suggestion Challenge

Avatar de Usuario
Dalamar
Site Admin
Mensajes: 8926
Registrado: 09 May 2012 01:38

Mercari Price Suggestion Challenge

Mensajepor Dalamar » 05 Dic 2017 06:58

La primera competicion de Kaggle que me presento.

Llevo unos cuantos dias dandole caña, la peculiaridad de esta competicion es que hay que correrla con Kernels de Kaggle, no vale con tener tu modelo local, entrenarlo y subir los resultados como en las otras, lo cual cambia mucho las reglas, ya que hay un limite de 1 hora de ejecucion del kernel.

A dia de hoy estoy en el top 4% con la posicion 22 de 637, lo cual no esta nada mal para ser la primera, pero queda mucho recorrido por delante, estoy pensando en publicar el kernel que me ha llevado a esa posicion para que los demas puedan aprovecharlo y seguire compitiendo en equipo con otras dos personas con las que he hablado, uno de Alemania y otro de Polonia, competir en equipo es lo mejor para motivarse y para aprender los unos de los otros.

Mi objetivo es llegar a tener una medalla de Bronce al final de la competicion y con un poco de suerte una medalla de bronce al publicar el kernel, con las conversaciones del foro tambien he obtenido una medalla de bronce en esta competicion, asi que objetivo conseguir las tres medallas en estos tres meses y aprender, muuucho!

Esta competicion tiene bastante de NLP, un tema muy interesante, aunque los mejores resultados se obtienen con redes neuronales complejas, algo que no va a ser posible con las limitaciones de esta competicion.

En paralelo estoy participando de forma menos intensiva en: Recruit Restaurant Visitor Forecasting

Y me estoy planteando participar en: Corporación Favorita Grocery Sales

Cada una tiene sus particularidades y la forma de abordarlas es muy diferente, por ejemplo en Corporación Favorita hay muchos datos y he estado experiementando con pyspark lo que me ha dado un bronce en el foro al compartir.
Adjuntos
KaggleProfile1st.JPG
¿Te ha gustado este hilo? Compartelo en las redes sociales para que se sume mas gente a la conversacion!

Avatar de Usuario
Dalamar
Site Admin
Mensajes: 8926
Registrado: 09 May 2012 01:38

Re: Mercari Price Suggestion Challenge

Mensajepor Dalamar » 05 Dic 2017 17:40

Publicar el kernel consiguio el resultado esperado, un bronce aunque lo han utilizado muchos y mejorado y he bajado unos cuantos puestos... A estas alturas de la competicion no tiene importancia y mi objetivo es conseguir los 5 bronces en kernels para ser "Kernel Expert". ;)
Adjuntos
KernelBronce.jpg
¿Te ha gustado este hilo? Compartelo en las redes sociales para que se sume mas gente a la conversacion!

Kaizen
Especulador Listillo
Mensajes: 256
Registrado: 30 Dic 2013 01:40
Contactar:

Re: Mercari Price Suggestion Challenge

Mensajepor Kaizen » 05 Dic 2017 22:16

Hmmmm, entendiendo que son competiciones de Data Science & Machine Learning, ¿qué lenguajes utilizáis? Y cómo funciona, ¿podrías aportar algo más descriptivo?

Gracias!!

Avatar de Usuario
Dalamar
Site Admin
Mensajes: 8926
Registrado: 09 May 2012 01:38

Re: Mercari Price Suggestion Challenge

Mensajepor Dalamar » 06 Dic 2017 05:37

Kaggle es muy conocido por cualquiera que este en Data Science y Machine Learning, es una web de competiciones que ahora pertenece a google y tiene competiciones multiples en las que hay premios superiores al millon de dolares.

Mira este hilo: viewtopic.php?f=142&t=2067
¿Te ha gustado este hilo? Compartelo en las redes sociales para que se sume mas gente a la conversacion!

Avatar de Usuario
Dalamar
Site Admin
Mensajes: 8926
Registrado: 09 May 2012 01:38

Re: Mercari Price Suggestion Challenge

Mensajepor Dalamar » 06 Dic 2017 07:35

Dos ideas en mente:

1. Redondeo, los precios finales son cifras exactas, y las extimaciones no lo son, si redondeamos obtenemos algun benefocio? Mis primeros tests dicen que no.

2. NLP feature engineering, los clasicos de numero de palabras, media, mediana y similares... ya estan implementados en este ejemplo, veremos si mejoran la prediccion: https://www.kaggle.com/viveknium/dynamic-pricing-with-feature-engineering
¿Te ha gustado este hilo? Compartelo en las redes sociales para que se sume mas gente a la conversacion!

Avatar de Usuario
Dalamar
Site Admin
Mensajes: 8926
Registrado: 09 May 2012 01:38

Re: Mercari Price Suggestion Challenge

Mensajepor Dalamar » 30 Dic 2017 07:05

Voy a probar a usar Word2Vec de gensim con el titulo y la descripcion, voy a usar como referencia el siguiente codigo:

- Instacart 12th: https://github.com/plantsgo/Instacart-Market-Basket-Analysis

Primer problema, out of memory con 32GB: https://groups.google.com/forum/#!topic/gensim/Q-35gYPj8H8
¿Te ha gustado este hilo? Compartelo en las redes sociales para que se sume mas gente a la conversacion!


Volver a “Competiciones de Kaggle”

Ingresar