Fix catcache invalidation of a list entry that's being built
authorHeikki Linnakangas <[email protected]>
Tue, 14 Jan 2025 16:54:56 +0000 (18:54 +0200)
committerHeikki Linnakangas <[email protected]>
Tue, 14 Jan 2025 16:54:56 +0000 (18:54 +0200)
If a new catalog tuple is inserted that belongs to a catcache list
entry, and cache invalidation happens while the list entry is being
built, the list entry might miss the newly inserted tuple.

To fix, change the way we detect concurrent invalidations while a
catcache entry is being built. Keep a stack of entries that are being
built, and apply cache invalidation to those entries in addition to
the real catcache entries. This is similar to the in-progress list in
relcache.c.

Back-patch to all supported versions. (This commit to v13 a few hours
later than other branches, because I somehow missed v13 in the first
batch.)

Reviewed-by: Noah Misch
Discussion: https://www.postgresql.org/message-id/2234dc98-06fe-42ed-b5db-ac17384dc880@iki.fi

src/backend/utils/cache/catcache.c
src/backend/utils/cache/inval.c
src/include/utils/catcache.h
src/tools/pgindent/typedefs.list

index b53232f627828be20837fae1a4cb3ea49e8e79cc..5032f9a33e4cc45bc2ad9447d148c5de74d894e7 100644 (file)
 #include "utils/resowner_private.h"
 #include "utils/syscache.h"
 
+/*
+ * If a catcache invalidation is processed while we are in the middle of
+ * creating a catcache entry (or list), it might apply to the entry we're
+ * creating, making it invalid before it's been inserted to the catcache.  To
+ * catch such cases, we have a stack of "create-in-progress" entries.  Cache
+ * invalidation marks any matching entries in the stack as dead, in addition
+ * to the actual CatCTup and CatCList entries.
+ */
+typedef struct CatCInProgress
+{
+   CatCache   *cache;          /* cache that the entry belongs to */
+   uint32      hash_value;     /* hash of the entry; ignored for lists */
+   bool        list;           /* is it a list entry? */
+   bool        dead;           /* set when the entry is invalidated */
+   struct CatCInProgress *next;
+} CatCInProgress;
+
+static CatCInProgress *catcache_in_progress_stack = NULL;
 
  /* #define CACHEDEBUG */  /* turns DEBUG elogs on */
 
@@ -90,8 +108,7 @@ static void CatCachePrintStats(int code, Datum arg);
 static void CatCacheRemoveCTup(CatCache *cache, CatCTup *ct);
 static void CatCacheRemoveCList(CatCache *cache, CatCList *cl);
 static void CatalogCacheInitializeCache(CatCache *cache);
-static CatCTup *CatalogCacheCreateEntry(CatCache *cache,
-                                       HeapTuple ntp, SysScanDesc scandesc,
+static CatCTup *CatalogCacheCreateEntry(CatCache *cache, HeapTuple ntp,
                                        Datum *arguments,
                                        uint32 hashValue, Index hashIndex);
 
@@ -603,6 +620,16 @@ CatCacheInvalidate(CatCache *cache, uint32 hashValue)
            /* could be multiple matches, so keep looking! */
        }
    }
+
+   /* Also invalidate any entries that are being built */
+   for (CatCInProgress *e = catcache_in_progress_stack; e != NULL; e = e->next)
+   {
+       if (e->cache == cache)
+       {
+           if (e->list || e->hash_value == hashValue)
+               e->dead = true;
+       }
+   }
 }
 
 /* ----------------------------------------------------------------
@@ -639,9 +666,15 @@ CreateCacheMemoryContext(void)
  *
  * This is not very efficient if the target cache is nearly empty.
  * However, it shouldn't need to be efficient; we don't invoke it often.
+ *
+ * If 'debug_discard' is true, we are being called as part of
+ * debug_discard_caches.  In that case, the cache is not reset for
+ * correctness, but just to get more testing of cache invalidation.  We skip
+ * resetting in-progress build entries in that case, or we'd never make any
+ * progress.
  */
 static void
-ResetCatalogCache(CatCache *cache)
+ResetCatalogCache(CatCache *cache, bool debug_discard)
 {
    dlist_mutable_iter iter;
    int         i;
@@ -680,6 +713,16 @@ ResetCatalogCache(CatCache *cache)
 #endif
        }
    }
+
+   /* Also invalidate any entries that are being built */
+   if (!debug_discard)
+   {
+       for (CatCInProgress *e = catcache_in_progress_stack; e != NULL; e = e->next)
+       {
+           if (e->cache == cache)
+               e->dead = true;
+       }
+   }
 }
 
 /*
@@ -689,6 +732,12 @@ ResetCatalogCache(CatCache *cache)
  */
 void
 ResetCatalogCaches(void)
+{
+   ResetCatalogCachesExt(false);
+}
+
+void
+ResetCatalogCachesExt(bool debug_discard)
 {
    slist_iter  iter;
 
@@ -698,7 +747,7 @@ ResetCatalogCaches(void)
    {
        CatCache   *cache = slist_container(CatCache, cc_next, iter.cur);
 
-       ResetCatalogCache(cache);
+       ResetCatalogCache(cache, debug_discard);
    }
 
    CACHE_elog(DEBUG2, "end of ResetCatalogCaches call");
@@ -732,7 +781,7 @@ CatalogCacheFlushCatalog(Oid catId)
        if (cache->cc_reloid == catId)
        {
            /* Yes, so flush all its contents */
-           ResetCatalogCache(cache);
+           ResetCatalogCache(cache, false);
 
            /* Tell inval.c to call syscache callbacks for this cache */
            CallSyscacheCallbacks(cache->id, 0);
@@ -1380,7 +1429,7 @@ SearchCatCacheMiss(CatCache *cache,
 
        while (HeapTupleIsValid(ntp = systable_getnext(scandesc)))
        {
-           ct = CatalogCacheCreateEntry(cache, ntp, scandesc, NULL,
+           ct = CatalogCacheCreateEntry(cache, ntp, NULL,
                                         hashValue, hashIndex);
            /* upon failure, we must start the scan over */
            if (ct == NULL)
@@ -1415,7 +1464,7 @@ SearchCatCacheMiss(CatCache *cache,
        if (IsBootstrapProcessingMode())
            return NULL;
 
-       ct = CatalogCacheCreateEntry(cache, NULL, NULL, arguments,
+       ct = CatalogCacheCreateEntry(cache, NULL, arguments,
                                     hashValue, hashIndex);
 
        /* Creating a negative cache entry shouldn't fail */
@@ -1543,6 +1592,8 @@ SearchCatCacheList(CatCache *cache,
    HeapTuple   ntp;
    MemoryContext oldcxt;
    int         i;
+   CatCInProgress *save_in_progress;
+   CatCInProgress in_progress_ent;
 
    /*
     * one-time startup overhead for each cache
@@ -1633,21 +1684,60 @@ SearchCatCacheList(CatCache *cache,
 
    ctlist = NIL;
 
+   /*
+    * Cache invalidation can happen while we're building the list.
+    * CatalogCacheCreateEntry() handles concurrent invalidation of individual
+    * tuples, but it's also possible that a new entry is concurrently added
+    * that should be part of the list we're building.  Register an
+    * "in-progress" entry that will receive the invalidation, until we have
+    * built the final list entry.
+    */
+   save_in_progress = catcache_in_progress_stack;
+   in_progress_ent.next = catcache_in_progress_stack;
+   in_progress_ent.cache = cache;
+   in_progress_ent.hash_value = lHashValue;
+   in_progress_ent.list = true;
+   in_progress_ent.dead = false;
+   catcache_in_progress_stack = &in_progress_ent;
+
    PG_TRY();
    {
        ScanKeyData cur_skey[CATCACHE_MAXKEYS];
        Relation    relation;
        SysScanDesc scandesc;
-       bool        stale;
 
        relation = table_open(cache->cc_reloid, AccessShareLock);
 
+       /*
+        * Scan the table for matching entries.  If an invalidation arrives
+        * mid-build, we will loop back here to retry.
+        */
        do
        {
            /*
-            * Ok, need to make a lookup in the relation, copy the scankey and
-            * fill out any per-call fields.  (We must re-do this when
-            * retrying, because systable_beginscan scribbles on the scankey.)
+            * If we are retrying, release refcounts on any items created on
+            * the previous iteration.  We dare not try to free them if
+            * they're now unreferenced, since an error while doing that would
+            * result in the PG_CATCH below doing extra refcount decrements.
+            * Besides, we'll likely re-adopt those items in the next
+            * iteration, so it's not worth complicating matters to try to get
+            * rid of them.
+            */
+           foreach(ctlist_item, ctlist)
+           {
+               ct = (CatCTup *) lfirst(ctlist_item);
+               Assert(ct->c_list == NULL);
+               Assert(ct->refcount > 0);
+               ct->refcount--;
+           }
+           /* Reset ctlist in preparation for new try */
+           ctlist = NIL;
+           in_progress_ent.dead = false;
+
+           /*
+            * Copy the scankey and fill out any per-call fields.  (We must
+            * re-do this when retrying, because systable_beginscan scribbles
+            * on the scankey.)
             */
            memcpy(cur_skey, cache->cc_skey, sizeof(ScanKeyData) * cache->cc_nkeys);
            cur_skey[0].sk_argument = v1;
@@ -1665,9 +1755,8 @@ SearchCatCacheList(CatCache *cache,
            /* The list will be ordered iff we are doing an index scan */
            ordered = (scandesc->irel != NULL);
 
-           stale = false;
-
-           while (HeapTupleIsValid(ntp = systable_getnext(scandesc)))
+           while (HeapTupleIsValid(ntp = systable_getnext(scandesc)) &&
+                  !in_progress_ent.dead)
            {
                uint32      hashValue;
                Index       hashIndex;
@@ -1709,30 +1798,13 @@ SearchCatCacheList(CatCache *cache,
                if (!found)
                {
                    /* We didn't find a usable entry, so make a new one */
-                   ct = CatalogCacheCreateEntry(cache, ntp, scandesc, NULL,
+                   ct = CatalogCacheCreateEntry(cache, ntp, NULL,
                                                 hashValue, hashIndex);
+
                    /* upon failure, we must start the scan over */
                    if (ct == NULL)
                    {
-                       /*
-                        * Release refcounts on any items we already had.  We
-                        * dare not try to free them if they're now
-                        * unreferenced, since an error while doing that would
-                        * result in the PG_CATCH below doing extra refcount
-                        * decrements.  Besides, we'll likely re-adopt those
-                        * items in the next iteration, so it's not worth
-                        * complicating matters to try to get rid of them.
-                        */
-                       foreach(ctlist_item, ctlist)
-                       {
-                           ct = (CatCTup *) lfirst(ctlist_item);
-                           Assert(ct->c_list == NULL);
-                           Assert(ct->refcount > 0);
-                           ct->refcount--;
-                       }
-                       /* Reset ctlist in preparation for new try */
-                       ctlist = NIL;
-                       stale = true;
+                       in_progress_ent.dead = true;
                        break;
                    }
                }
@@ -1744,7 +1816,7 @@ SearchCatCacheList(CatCache *cache,
            }
 
            systable_endscan(scandesc);
-       } while (stale);
+       } while (in_progress_ent.dead);
 
        table_close(relation, AccessShareLock);
 
@@ -1770,6 +1842,9 @@ SearchCatCacheList(CatCache *cache,
    }
    PG_CATCH();
    {
+       Assert(catcache_in_progress_stack == &in_progress_ent);
+       catcache_in_progress_stack = save_in_progress;
+
        foreach(ctlist_item, ctlist)
        {
            ct = (CatCTup *) lfirst(ctlist_item);
@@ -1788,6 +1863,8 @@ SearchCatCacheList(CatCache *cache,
        PG_RE_THROW();
    }
    PG_END_TRY();
+   Assert(catcache_in_progress_stack == &in_progress_ent);
+   catcache_in_progress_stack = save_in_progress;
 
    cl->cl_magic = CL_MAGIC;
    cl->my_cache = cache;
@@ -1848,23 +1925,6 @@ ReleaseCatCacheList(CatCList *list)
 }
 
 
-/*
- * equalTuple
- *     Are these tuples memcmp()-equal?
- */
-static bool
-equalTuple(HeapTuple a, HeapTuple b)
-{
-   uint32      alen;
-   uint32      blen;
-
-   alen = a->t_len;
-   blen = b->t_len;
-   return (alen == blen &&
-           memcmp((char *) a->t_data,
-                  (char *) b->t_data, blen) == 0);
-}
-
 /*
  * CatalogCacheCreateEntry
  *     Create a new CatCTup entry, copying the given HeapTuple and other
@@ -1872,34 +1932,33 @@ equalTuple(HeapTuple a, HeapTuple b)
  *
  * To create a normal cache entry, ntp must be the HeapTuple just fetched
  * from scandesc, and "arguments" is not used.  To create a negative cache
- * entry, pass NULL for ntp and scandesc; then "arguments" is the cache
- * keys to use.  In either case, hashValue/hashIndex are the hash values
- * computed from the cache keys.
+ * entry, pass NULL for ntp; then "arguments" is the cache keys to use.
+ * In either case, hashValue/hashIndex are the hash values computed from
+ * the cache keys.
  *
  * Returns NULL if we attempt to detoast the tuple and observe that it
  * became stale.  (This cannot happen for a negative entry.)  Caller must
  * retry the tuple lookup in that case.
  */
 static CatCTup *
-CatalogCacheCreateEntry(CatCache *cache, HeapTuple ntp, SysScanDesc scandesc,
-                       Datum *arguments,
+CatalogCacheCreateEntry(CatCache *cache, HeapTuple ntp, Datum *arguments,
                        uint32 hashValue, Index hashIndex)
 {
    CatCTup    *ct;
-   HeapTuple   dtp;
    MemoryContext oldcxt;
 
    if (ntp)
    {
        int         i;
+       HeapTuple   dtp = NULL;
 
        /*
-        * The visibility recheck below essentially never fails during our
-        * regression tests, and there's no easy way to force it to fail for
-        * testing purposes.  To ensure we have test coverage for the retry
-        * paths in our callers, make debug builds randomly fail about 0.1% of
-        * the times through this code path, even when there's no toasted
-        * fields.
+        * The invalidation of the in-progress entry essentially never happens
+        * during our regression tests, and there's no easy way to force it to
+        * fail for testing purposes.  To ensure we have test coverage for the
+        * retry paths in our callers, make debug builds randomly fail about
+        * 0.1% of the times through this code path, even when there's no
+        * toasted fields.
         */
 #ifdef USE_ASSERT_CHECKING
        if (random() <= (MAX_RANDOM_VALUE / 1000))
@@ -1915,34 +1974,34 @@ CatalogCacheCreateEntry(CatCache *cache, HeapTuple ntp, SysScanDesc scandesc,
         */
        if (HeapTupleHasExternal(ntp))
        {
-           bool        need_cmp = IsInplaceUpdateOid(cache->cc_reloid);
-           HeapTuple   before = NULL;
-           bool        matches = true;
-
-           if (need_cmp)
-               before = heap_copytuple(ntp);
-           dtp = toast_flatten_tuple(ntp, cache->cc_tupdesc);
+           CatCInProgress *save_in_progress;
+           CatCInProgress in_progress_ent;
 
            /*
             * The tuple could become stale while we are doing toast table
-            * access (since AcceptInvalidationMessages can run then).
-            * equalTuple() detects staleness from inplace updates, while
-            * systable_recheck_tuple() detects staleness from normal updates.
-            *
-            * While this equalTuple() follows the usual rule of reading with
-            * a pin and no buffer lock, it warrants suspicion since an
-            * inplace update could appear at any moment.  It's safe because
-            * the inplace update sends an invalidation that can't reorder
-            * before the inplace heap change.  If the heap change reaches
-            * this process just after equalTuple() looks, we've not missed
-            * its inval.
+            * access (since AcceptInvalidationMessages can run then).  The
+            * invalidation will mark our in-progress entry as dead.
             */
-           if (need_cmp)
+           save_in_progress = catcache_in_progress_stack;
+           in_progress_ent.next = catcache_in_progress_stack;
+           in_progress_ent.cache = cache;
+           in_progress_ent.hash_value = hashValue;
+           in_progress_ent.list = false;
+           in_progress_ent.dead = false;
+           catcache_in_progress_stack = &in_progress_ent;
+
+           PG_TRY();
            {
-               matches = equalTuple(before, ntp);
-               heap_freetuple(before);
+               dtp = toast_flatten_tuple(ntp, cache->cc_tupdesc);
            }
-           if (!matches || !systable_recheck_tuple(scandesc, ntp))
+           PG_FINALLY();
+           {
+               Assert(catcache_in_progress_stack == &in_progress_ent);
+               catcache_in_progress_stack = save_in_progress;
+           }
+           PG_END_TRY();
+
+           if (in_progress_ent.dead)
            {
                heap_freetuple(dtp);
                return NULL;
index 8fe1f0d922259609f93d9f79b1af32a7d8c57064..fc4412df4a1a8e1fd2d6a289c697189b05c2ade8 100644 (file)
@@ -665,7 +665,7 @@ InvalidateSystemCachesExtended(bool debug_discard)
    int         i;
 
    InvalidateCatalogSnapshot();
-   ResetCatalogCaches();
+   ResetCatalogCachesExt(debug_discard);
    RelationCacheInvalidate(debug_discard); /* gets smgr and relmap too */
 
    for (i = 0; i < syscache_callback_count; i++)
index f4aa316604e6d06ed1484f9c2f561e202fded208..3f8688d4ae372182a1e62fcbc8563e54bc271198 100644 (file)
@@ -218,6 +218,7 @@ extern CatCList *SearchCatCacheList(CatCache *cache, int nkeys,
 extern void ReleaseCatCacheList(CatCList *list);
 
 extern void ResetCatalogCaches(void);
+extern void ResetCatalogCachesExt(bool debug_discard);
 extern void CatalogCacheFlushCatalog(Oid catId);
 extern void CatCacheInvalidate(CatCache *cache, uint32 hashValue);
 extern void PrepareToInvalidateCacheTuple(Relation relation,
index f55dc102937c05098a69956513055a31cd605e77..513dbb9f01b494243a3e9eedf7f40241df037572 100644 (file)
@@ -324,6 +324,7 @@ CaseTestExpr
 CaseWhen
 Cash
 CastInfo
+CatCInProgress
 CatCList
 CatCTup
 CatCache