The goal of this task is to analyze TripAdvisor reviews and classify them based on three key aspects: sentiment polarity, type of site, and associated Pueblo Mágico.
Each review contains valuable information about a traveler's experience, and our objective is to extract meaningful insights from it. First, we need to determine the sentiment polarity of the review by assigning it a rating from 1 (very negative) to 5 (very positive), based on the original score given by the tourist. This will help in understanding overall visitor satisfaction.
Next, we classify the review according to the type of site being reviewed. The review could describe a hotel, a restaurant, or an attraction, and this categorization is based on contextual keywords and available metadata.
Finally, we need to identify which Pueblo Mágico the review belongs to. This is done by analyzing location metadata, ensuring that each review is correctly assigned to its respective destination.
• “Un callejón donde tienes que besar a tu amante por años de felicidad, en el amor es parte de un mito en esta ciudad especial. El callejón estrecho con escalones no es muy especial en sí mismo. Lo que lo hace especial es toda la historia a su alrededor”
– Magical Town: Dolores Hidalgo
– Polarity: 3 (Neutral)
– Type: Attractive
• “Es un paseo bonito, las ruinas están muy bien cuidadas , no son pirámides completas pero si son interesantes, sobre todo si además subes a la iglesia que se construyó arriba de la pirámide . Para nosotros fue un buen ejercicio”
– Magical Town: Cholula
– Polarity: 4 (Positive)
– Type: Attractive
“Un lugar que con el tiempo ya decayó mucho en Tulum, en el precio muy caro a pesar que desayunas y el café en otras cafeterías te lo rellenan hay quieres otra taza que además es muy pequeña te cuesta 100 pesos por micro taza de verdad nada recomendable por el abuso que hacen. Además ponen paquetes de desayuno que incluye café pero llegamos 5 minutos pasadito el medio día y no nos quisieron dar el paquete”
– Magical Town: Tulum
– Polarity: 1 (Very Negative)
– Type: Restaurant
The corpus consists of more than 200,000 opinions shared divided on 70 % for training and the rest 30 % for test.