mtransitapps · mmathieum · Jun 4, 2026 · gemini-code-assist · Jun 4, 2026 · gemini-code-assist
diff --git a/src/main/java/org/mtransit/commons/CleanUtils.java b/src/main/java/org/mtransit/commons/CleanUtils.java
@@ -587,23 +587,13 @@ public static String fixMcXCase(@NotNull String string) { // Mccowan -> McCowan
 			"([^" + WORD_REGEX_FR + "]*)([" + WORD_REGEX_FR + "]+)([^" + WORD_REGEX_FR + "]*)",
 			Pattern.CASE_INSENSITIVE | RegexUtils.fUNICODE_CHARACTER_CLASS() | RegexUtils.fCANON_EQ());
 
-	@NotNull
-	public static String toLowerCaseUpperCaseStrings(@NotNull Locale locale, @NotNull String string, @NotNull String... ignoreWords) {
-		if (string.isEmpty()) return string;
-		if (Arrays.asList(ignoreWords).contains(string.trim())) return string;
-		if (CharUtils.isUppercaseOnly(string, true, true)) {
-			return string.toLowerCase(locale);
-		}
-		return string;
-	}
-
 	@NotNull
 	public static String toLowerCaseUpperCaseWords(@NotNull Locale locale, @NotNull String string, @NotNull String... ignoreWords) {
 		if (string.isEmpty()) return string;
 		final float charCount = string.length();
 		final float upperCaseCount = CharUtils.countUpperCase(string);
 		final float percent = upperCaseCount / charCount;
-		if (percent < .25f) { // 25%
+		if (percent < .33f) { // 33%
 			return string;
 		}
 		StringBuilder sb = new StringBuilder();
@@ -612,7 +602,7 @@ public static String toLowerCaseUpperCaseWords(@NotNull Locale locale, @NotNull
 		while (matcher.find()) {
 			sb.append(matcher.group(1)); // before
 			final String word = matcher.group(2);
-			if (!word.isEmpty()
+			if (word.length() > 1 // do not lower case single letter
 					&& CharUtils.isUppercaseOnly(word, false, true)
 					&& !CharUtils.isRomanDigits(word)
 					&& !containsIgnoreCase(word, ignoreWords)) {
@@ -634,6 +624,16 @@ private static boolean containsIgnoreCase(@Nullable String string, @NotNull Stri
 		return false;
 	}
 
+	@NotNull
+	public static String toLowerCaseUpperCaseStrings(@NotNull Locale locale, @NotNull String string, @NotNull String... ignoreWords) {
+		if (string.isEmpty()) return string;
+		if (Arrays.asList(ignoreWords).contains(string.trim())) return string;
+		if (CharUtils.isUppercaseOnly(string, true, true)) {
+			return string.toLowerCase(locale);
+		}
+		return string;
+	}
+
 	public static final Regex ALL_FACE_A_REGEX = CleanUtilsExtKt.makeALL_FACE_A_REGEX();
 	public static final String ALL_FACE_A_REGEX_REPLACEMENT = CleanUtilsExtKt.makeALL_FACE_A_REGEX_REPLACEMENT();
 

diff --git a/src/main/java/org/mtransit/commons/StringsCleaner.kt b/src/main/java/org/mtransit/commons/StringsCleaner.kt
@@ -1,12 +1,18 @@
 package org.mtransit.commons
 
-import org.mtransit.commons.StringUtils.EMPTY
+import org.jetbrains.annotations.VisibleForTesting
 import java.util.Locale
 
 object StringsCleaner {
 
     private const val ROUTE_LONG_NAME_SHORT_MAX_LENGTH = 33
 
+    private val LINE_AND_SHORT_NAME = Regex("""(?U)(^|\s+)line\s+(\w+)""", RegexOption.IGNORE_CASE)
+    private const val LINE_AND_SHORT_NAME_REPLACEMENT = "$1$2"
+
+    private val FR_LIGNE_AND_SHORT_NAME = Regex("""(?U)(^|\s+)ligne\s+(\w+)""", RegexOption.IGNORE_CASE)
+    private const val FR_LIGNE_AND_SHORT_NAME_REPLACEMENT = "$1$2"
+
     @JvmOverloads
     @JvmStatic
     fun cleanRouteLongName(
@@ -19,17 +25,24 @@ object StringsCleaner {
     ): String {
         var routeLongName = originalRouteLongName
         if (languages?.contains(Locale.ENGLISH) == true) {
-            routeLongName = CleanUtils.LINE_.matcher(routeLongName).replaceAll(EMPTY)
+            routeLongName = LINE_AND_SHORT_NAME.replace(routeLongName, LINE_AND_SHORT_NAME_REPLACEMENT)
         }
         if (languages?.contains(Locale.FRENCH) == true) {
-            routeLongName = CleanUtils.FR_CA_LIGNE.matcher(routeLongName).replaceAll(EMPTY)
+            routeLongName = FR_LIGNE_AND_SHORT_NAME.replace(routeLongName, FR_LIGNE_AND_SHORT_NAME_REPLACEMENT)
         }
         val makeShorter = routeLongName.length > ROUTE_LONG_NAME_SHORT_MAX_LENGTH && routeLongName.contains(' ')
-        routeLongName = cleanString(routeLongName, languages, lowerUCStrings, lowerUCWords, *ignoredUCWords, short = makeShorter, shortMaxLength = ROUTE_LONG_NAME_SHORT_MAX_LENGTH)
+        routeLongName = cleanString(routeLongName, languages, makeShorter, ROUTE_LONG_NAME_SHORT_MAX_LENGTH, lowerUCStrings, lowerUCWords, *ignoredUCWords)
         return routeLongName
     }
 
-    private const val TRIP_HEADSIGN_SHORT_MAX_LENGTH = 13
+    @VisibleForTesting
+    internal const val TRIP_HEADSIGN_SHORT_MAX_LENGTH = 13
+
+    private val STATION_AND_NAME = Regex("""(?U)(^|\s+)station\s+(\w+)""", RegexOption.IGNORE_CASE)
+    private const val STATION_AND_NAME_REPLACEMENT = "$1$2"
+
+    private val FR_STATION_AND_NAME = Regex("""(?U)(^|\s+)station\s+(\w+)""", RegexOption.IGNORE_CASE)
+    private const val FR_STATION_AND_NAME_REPLACEMENT = "$1$2"
 
     @JvmOverloads
     @JvmStatic
@@ -49,15 +62,15 @@ object StringsCleaner {
                 1, // subway
                 2, // train/rail
                     -> {
-                    tripHeadsign = CleanUtils.STATION.matcher(tripHeadsign).replaceAll(EMPTY)
+                    tripHeadsign = STATION_AND_NAME.replace(tripHeadsign, STATION_AND_NAME_REPLACEMENT)
                 }
             }
         }
         if (languages?.contains(Locale.FRENCH) == true) {
             when (routeType) {
                 1, // subway
                     -> {
-                    tripHeadsign = CleanUtils.FR_CA_STATION.matcher(tripHeadsign).replaceAll(EMPTY)
+                    tripHeadsign = FR_STATION_AND_NAME.replace(tripHeadsign, FR_STATION_AND_NAME_REPLACEMENT)
                 }
             }
         }
@@ -75,7 +88,7 @@ object StringsCleaner {
             }
         }
         val makeShorter = tripHeadsign.length > TRIP_HEADSIGN_SHORT_MAX_LENGTH && tripHeadsign.contains(' ')
-        tripHeadsign = cleanString(tripHeadsign, languages, lowerUCStrings, lowerUCWords, *ignoredUCWords, short = makeShorter, shortMaxLength = TRIP_HEADSIGN_SHORT_MAX_LENGTH)
+        tripHeadsign = cleanString(tripHeadsign, languages, makeShorter, TRIP_HEADSIGN_SHORT_MAX_LENGTH, lowerUCStrings, lowerUCWords, *ignoredUCWords)
         if (tripHeadsign.length > TRIP_HEADSIGN_SHORT_MAX_LENGTH) {
             tripHeadsign = CleanUtils.cleanSlashes(tripHeadsign, true)
         }
@@ -101,24 +114,32 @@ object StringsCleaner {
                 1, // subway
                 2, // train/rail
                     -> {
-                    stopName = CleanUtils.STATION.matcher(stopName).replaceAll(EMPTY)
+                    stopName = STATION_AND_NAME.replace(stopName, STATION_AND_NAME_REPLACEMENT)
+                }
+            }
+        }
+        if (languages?.contains(Locale.FRENCH) == true) {
+            when (routeType) {
+                1, // subway
+                    -> {
+                    stopName = FR_STATION_AND_NAME.replace(stopName, FR_STATION_AND_NAME_REPLACEMENT)
                 }
             }
-
         }
         val makeShorter = stopName.length > STOP_NAME_SHORT_MAX_LENGTH && stopName.contains(' ')
-        stopName = cleanString(stopName, languages, lowerUCStrings, lowerUCWords, *ignoredUCWords, short = makeShorter, shortMaxLength = STOP_NAME_SHORT_MAX_LENGTH)
+        stopName = cleanString(stopName, languages, makeShorter, STOP_NAME_SHORT_MAX_LENGTH, lowerUCStrings, lowerUCWords, *ignoredUCWords)
         return stopName
     }
 
-    private fun cleanString(
+    @VisibleForTesting
+    internal fun cleanString(
         originalString: String,
         languages: List<Locale>?,
+        short: Boolean,
+        shortMaxLength: Int,
         lowerUCStrings: Boolean = false,
         lowerUCWords: Boolean = false,
         vararg ignoredUCWords: String = emptyArray(),
-        short: Boolean,
-        shortMaxLength: Int,
     ): String {
         var string = originalString
         languages?.forEach { language ->
@@ -149,12 +170,13 @@ object StringsCleaner {
                 string = CleanUtils.ALL_CHARS_REGEX.replace(string, CleanUtils.ALL_CHARS_REGEX_REPLACEMENT)
             }
         }
-        val capitalize = lowerUCStrings || lowerUCWords // only capitalize if lower case was called
         languages?.forEach { language ->
             if (short && string.length > shortMaxLength) {
                 string = CleanUtils.cleanBounds(language, string)
             }
-            string = CleanUtils.cleanLabel(language, string, capitalize)
+        }
+        languages?.firstOrNull()?.let { language ->
+            string = CleanUtils.cleanLabel(language, string, true) // only 1st language
         }
         return string
     }

diff --git a/src/main/java/org/mtransit/commons/provider/OttawaOCTranspoProviderCommons.kt b/src/main/java/org/mtransit/commons/provider/OttawaOCTranspoProviderCommons.kt
@@ -10,7 +10,7 @@ object OttawaOCTranspoProviderCommons {
     private val FIX_CAIRINE_WILSON_ = CleanUtils.cleanWords("carine wilson")
     private val FIX_CAIRINE_WILSON_REPLACEMENT = CleanUtils.cleanWordsReplacement("Cairine Wilson")
 
-    private val REMOVE_SECOND_LANGUAGE = Pattern.compile("( ~ .*$)") // FIXME i18n head-signs
+    private val REMOVE_SECOND_LANGUAGE = Pattern.compile("(\\s+~\\s+[^<>]+?)(?=\\s*<>|$)") // FIXME i18n head-signs
-    private val REMOVE_SECOND_LANGUAGE = Pattern.compile("(\\s+~\\s+[^<>]+?)(?=\\s*<>|$)") // FIXME i18n head-signs
+    private val REMOVE_SECOND_LANGUAGE = Pattern.compile("(\\s+~\\s+[^<>]+)(?=\\s*<>|$)") // FIXME i18n head-signs
-    private val REMOVE_SECOND_LANGUAGE = Pattern.compile("(\\s+~\\s+[^<>]+?)(?=\\s*<>|$)") // FIXME i18n head-signs
+    private val REMOVE_SECOND_LANGUAGE = Pattern.compile("(\\s+~\\s+[^<>]+)(?=\\s*<>|$)") // FIXME i18n head-signs
 
     @JvmStatic
     fun cleanTripHeadsign(tripHeadSign: String, @Suppress("unused") vararg ignoreWords: String): String {

diff --git a/src/test/java/org/mtransit/commons/CleanUtilsKtTests.kt b/src/test/java/org/mtransit/commons/CleanUtilsKtTests.kt
@@ -1,5 +1,6 @@
 package org.mtransit.commons
 
+import java.util.Locale
 import kotlin.test.BeforeTest
 import kotlin.test.Test
 import kotlin.test.assertEquals
@@ -11,6 +12,25 @@ class CleanUtilsKtTests {
         CommonsApp.setup(false)
     }
 
+    @Test
+    fun test_toLowerCaseUpperCaseWords() {
+        "MARY'S".let {
+            CleanUtils.toLowerCaseUpperCaseWords(Locale.ENGLISH, it)
+        }.let {
+            assertEquals("mary's", it)
+        }
+        "d'AYLMER".let {
+            CleanUtils.toLowerCaseUpperCaseWords(Locale.FRENCH, it)
+        }.let {
+            assertEquals("d'aylmer", it)
+        }
+        "Fallowfield <> Limebank & CFIA ~ ACIA".let {
+            CleanUtils.toLowerCaseUpperCaseWords(Locale.ENGLISH, it)
+        }.let {
+            assertEquals("Fallowfield <> Limebank & CFIA ~ ACIA", it)
+        }
+    }
+
     @Test
     fun test_keepOrRemoveVia_keepVia() {
         // Arrange

diff --git a/src/test/java/org/mtransit/commons/CleanUtilsTests.java b/src/test/java/org/mtransit/commons/CleanUtilsTests.java
@@ -495,5 +495,11 @@ public void testRemoveVia_KeepOnlyVia2() {
 	public void test_toLowerCaseUpperCaseStrings() {
 		String result = CleanUtils.toLowerCaseUpperCaseStrings(Locale.ENGLISH, "YMCA ", "YMCA");
 		assertEquals("YMCA ", result);
+
+		result = CleanUtils.toLowerCaseUpperCaseStrings(Locale.ENGLISH, "1 UPPERCASE, ONLY.");
+		assertEquals("1 uppercase, only.", result);
+
+		result = CleanUtils.toLowerCaseUpperCaseStrings(Locale.ENGLISH, "2 Uppercase, Capitalized.");
+		assertEquals("2 Uppercase, Capitalized.", result);
 	}
 }
diff --git a/src/test/java/org/mtransit/commons/StringsCleanerTests.kt b/src/test/java/org/mtransit/commons/StringsCleanerTests.kt
@@ -9,7 +9,21 @@ class StringsCleanerTests {
 
     @BeforeTest
     fun setUp() {
-        CommonsApp.setup(false);
+        CommonsApp.setup(false)
+    }
+
+    @Test
+    fun test_cleanStopName() {
+        "Station Mont-Royal".let { stopName ->
+            StringsCleaner.cleanStopName(stopName, languages = listOf(Locale.FRENCH), routeType = 1) // subway
+        }.let { result ->
+            assertEquals("Mont-Royal", result)
+        }
+        "Station Édouard-Montpetit".let { stopName ->
+            StringsCleaner.cleanStopName(stopName, languages = listOf(Locale.FRENCH), routeType = 1) // subway
+        }.let { result ->
+            assertEquals("Édouard-Montpetit", result)
+        }
     }
 
     @Test
@@ -39,17 +53,51 @@ class StringsCleanerTests {
         }.let { result ->
             assertEquals("Angora/Gascon/Terrebonne/Cégep Terrebonne", result)
         }
+        "Bell H.S".let { tripHeadsign ->
+            StringsCleaner.cleanTripHeadsign(tripHeadsign, languages = listOf(Locale.ENGLISH), routeType = 3, lowerUCWords = true)
+        }.let { result ->
+            assertEquals("Bell HS", result)
+        }
     }
 
     @Test
     fun test_cleanRouteLongName() {
-        "Tunney's Pasture <> Bridlewood".let {
+        "Tenth Line <> Place D'Orléans".let {
             StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH), routeType = 3)
         }.let { result ->
-            assertEquals("Tunney's Pasture <> Bridlewood", result)
+            assertEquals("Tenth Line <> Place D'Orléans", result)
+        }
+        "Line 10".let {
+            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH), routeType = 3)
+        }.let { result ->
+            assertEquals("10", result)
+        }
+        " Line 10".let {
+            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH), routeType = 3)
+        }.let { result ->
+            assertEquals("10", result)
+        }
+        "The Line 10".let {
+            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH), routeType = 3)
+        }.let { result ->
+            assertEquals("The 10", result)
         }
+        "Online 10".let {
+            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH), routeType = 3)
+        }.let { result ->
+            assertEquals("Online 10", result)
+        }
+        "John McCrae H.S <> Half Moon Bay".let {
+            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH, Locale.FRENCH), routeType = 3, lowerUCWords = true)
+        }.let { result ->
+            assertEquals("John McCrae HS <> Half Moon Bay", result)
+        }
+    }
+
+    @Test
+    fun test_cleanRouteLongName_Capitalize() {
         "Tunney's Pasture <> Bridlewood".let {
-            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.FRENCH, Locale.ENGLISH), routeType = 3)
+            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH), routeType = 3)
         }.let { result ->
             assertEquals("Tunney's Pasture <> Bridlewood", result)
         }
@@ -61,8 +109,17 @@ class StringsCleanerTests {
         "Tunney's Pasture <> Bridlewood".let {
             StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH, Locale.FRENCH), routeType = 3, lowerUCWords = true)
         }.let { result ->
-            assertEquals("Tunney'S Pasture <> Bridlewood", result) // too bad
+            assertEquals("Tunney's Pasture <> Bridlewood", result)
+        }
+        "tunney's pasture <> bridlewood".let {
+            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH, Locale.FRENCH), routeType = 3, lowerUCWords = true)
+        }.let { result ->
+            assertEquals("Tunney's Pasture <> Bridlewood", result)
+        }
+        "tunney's pasture <> bridlewood".let {
+            StringsCleaner.cleanRouteLongName(it, languages = listOf(Locale.ENGLISH, Locale.FRENCH), routeType = 3)
+        }.let { result ->
+            assertEquals("Tunney's Pasture <> Bridlewood", result)
         }
-
     }
 }